question term extraction – indexation du corpus

ForumCategory: Questionsquestion term extraction – indexation du corpus
slouvel asked 2 months ago

Bonjour,
j’ai effectué le script term extraction sur un corpus. dois-je “nettoyer” la liste de termes sur le CSV “extracted term list” ou bien sur le “CSV indexed term list” ?
Une fois cette opération de nettoyage réalisée, est-il exact que je dois réindexer le corpus avec la nouvelle liste de termes ? Pour cela, Cortext propose seulement d’utiliser “extracted term list” ?
merci pour vos réponses
 

1 Answers
Jean-Philippe Cointet Staff answered 2 months ago

Par défaut, la liste de terme extraite est automatiquement indexée pour produire une nouvelle variable Terms. 
Il est possible (et probable) que vous souhaitiez apporter quelques ajustements à cette liste. Les changements doivent être fait en local dans open office ou Google Sheets, enregistré au même format (tabulé) puis uploadés dans le manager (en indiquant term list comme “Data Type”). Par suite il est nécessaire d’indexer le corpus en fonction de cette liste mise à jour grâce au script corpus_term_indexer. 
 

learn about CorText scripts and share your experience