grouping strings with different stems

Cortext Manager Q&A forum › Category: Text processing › grouping strings with different stems

Bonjour Lionel,
Je travaille sur un corpus issu de Scopus. A partir du fichier produit par corpus text builder, j’ai fusionné dans la troisième colonne “forms” plusieurs lignes à l’aide du séparateur |&|, (par exemple “nitrogen|&|nitrate|&|nitrates|&|carbon|&|phosphate|&|phosphates”) dans l’intention de créer de grandes catégories maisons (comme chemistry, fish, tree, water, …), . Puis-je indiquer ces nouveaux noms de catégories dans la 2ème colonne “main form”. Est-ce acceptable de fusionner ainsi des formes qui n’ont pas du tout la même racine ?
j’ai l’impression dans les résultats sous demography et corpus list builder que cortext a bien fusionné ces champs (fréquences calculées sont bien le cumul), mais il conserve comme intitulé une des racines initiales. Dans quelle colonne du fichier .csv dois-je indiquer ces nouveaux noms de catégories (comme”chemistry”) qui ne correspond pas à une racine existante pour que cette catégorie soit ensuite reconnue comme entité dans les scripts demography et corpus list builder ?
Dans ce processus de fusion, est-ce équivalent d’indiquer w dans la dernière colonne ou de supprimer la ligne correspondante quand on réutilise ensuite le fichier .csv pour corpus text indexer?

Question Tags: dictionary

aleabdo Staff replied 5 years ago

Ni! Bonjour Gabrielle – Lionel est en congés,

> Puis-je indiquer ces nouveaux noms de catégories dans la 2ème colonne “main form”?

Oui.

> Est-ce acceptable de fusionner ainsi des formes qui n’ont pas du tout la même racine ?

Oui.

> Dans quelle colonne du fichier .csv dois-je indiquer ces nouveaux noms de catégories (comme”chemistry”) qui ne correspond pas à une racine existante pour que cette catégorie soit ensuite reconnue comme entité dans les scripts demography et corpus list builder ?

Voir les réponses précedentes.

> Dans ce processus de fusion, est-ce équivalent d’indiquer w dans la dernière colonne ou de supprimer la ligne correspondante quand on réutilise ensuite le fichier .csv pour corpus text indexer?

Oui.

Abraços,
.~´

Gabrielle Bouleau replied 5 years ago

Merci beaucoup Ale !

1 Answers

0 Vote Up Vote Down

Lionel Staff answered 5 years ago

See below !

Cortext Manager Documentation

Learn about Cortext methods and share your experiences