CorText Manager 2021 training sessions : troisième session

Présentation de SASHIMI, puis atelier sur vos questions de recherche et vos corpus.

Voir le programme détaillé.


Dans le cadre de mes travaux, recherches, enquêtes (...), j'ai rassemblé un ensemble de données que je souhaiterais utiliser en session !
Précisez, par exemple : presse, notices bibliographiques, données d'enquête, données de terrain, brevets... Si vous ne disposez pas d'un corpus constitué, un corpus de test vous sera proposé correspondant, si possible, à vos attentes.

Quel corpus ?

Nombre de lignes, nombre de variables (colonne), nombre de fichiers différents... Taille en Mo.
Sous quel format est stocké cette information (pdf, txt, xls, sql...).

Votre corpus et CorText Manager

1/ types de format de corpus avec les Ready-made sources et les formats plus génériques afin de préparer le dépôt de votre corpus sur CorText Manager dans un dossier zip.

2/ opération consistant à parcourir ce dossier zip pour structurer l'information de sorte qu'elle soit exploitable par CorText Manager (étape du parsing).