grouping strings with different stems

CorText Manager Q&A forumCategory: Text processinggrouping strings with different stems
Gabrielle Bouleau asked 4 years ago

Bonjour Lionel,
Je travaille sur un corpus issu de Scopus. A partir du fichier produit par corpus text builder, j’ai fusionné dans la troisième colonne “forms” plusieurs lignes à l’aide du séparateur |&|, (par exemple “nitrogen|&|nitrate|&|nitrates|&|carbon|&|phosphate|&|phosphates”) dans l’intention de créer de grandes catégories maisons (comme chemistry, fish, tree, water, …),  . Puis-je indiquer ces nouveaux noms de catégories dans la 2ème colonne “main form”. Est-ce acceptable de fusionner ainsi des formes qui n’ont pas du tout la même racine ? 
j’ai l’impression dans les résultats sous demography et corpus list builder que cortext a bien fusionné ces champs (fréquences calculées sont bien le cumul), mais il conserve comme intitulé une des racines initiales. Dans quelle colonne du fichier .csv dois-je indiquer ces nouveaux noms de catégories (comme”chemistry”) qui ne correspond pas à une racine existante pour que cette catégorie soit ensuite reconnue comme entité dans les scripts demography et corpus list builder ?
Dans ce processus de fusion, est-ce équivalent d’indiquer w dans la dernière colonne ou de supprimer la ligne correspondante quand on réutilise ensuite le fichier .csv pour corpus text indexer?

aleabdo Staff replied 4 years ago

Ni! Bonjour Gabrielle – Lionel est en congés,

> Puis-je indiquer ces nouveaux noms de catégories dans la 2ème colonne “main form”?

Oui.

> Est-ce acceptable de fusionner ainsi des formes qui n’ont pas du tout la même racine ?

Oui.

> Dans quelle colonne du fichier .csv dois-je indiquer ces nouveaux noms de catégories (comme”chemistry”) qui ne correspond pas à une racine existante pour que cette catégorie soit ensuite reconnue comme entité dans les scripts demography et corpus list builder ?

Voir les réponses précedentes.

> Dans ce processus de fusion, est-ce équivalent d’indiquer w dans la dernière colonne ou de supprimer la ligne correspondante quand on réutilise ensuite le fichier .csv pour corpus text indexer?

Oui.

Abraços,
.~´

Gabrielle Bouleau replied 4 years ago

Merci beaucoup Ale !

1 Answers
Lionel Staff answered 4 years ago

See below !