term extraction langage

Bilel Staff asked 8 years ago

Bonjour,

J’utilise le script terms_extraction pour détecter des entités nommées dans un corpus Factiva. Je compare deux corpus tirés de Factiva: un corpus d’article de presse en français et un autre en anglais (je fais une comparaison France/US).

Lorsque j’utilise terms_exctraction pour mon corpus en français, les noms de ministre, d’experts, d’administrations et  d’organisations apparaissent. Je sépare ces entités pour faire une liste de termes qui contient que des acteurs, ce qui me permet de créer une variable acteur et de faire des cartes hétérogènes.

Malheureusement, pour mon corpus en anglais aucun nom de personne ou d’organisation n’apparait.  J’ai bien choisi la bonne langue pour chaque corpus Je suis bien embêté, c’est une dimension importante de la recherche que je mène en ce moment.

terms extraction fonctionne-t-il différemment pour l’anglais?

Merci de votre réponse