Tag clusters et heatmap

TAROT asked 8 years ago

Bonjour,

Nous travaillons actuellement sur les affiliations des auteurs de notre corpus et avons donc quelques interrogations à ce propos notamment lorsque l’on utilise la fonction “tag clusters”. Nous sommes assez surprises de voir apparaître certaines institutions ou certains pays d’affiliations lorsque l’on “tague” nos clusters avec ces 2 champs (car cela parfois correspond à une institution citée une seule fois). Ou alors, nous avons mal compris la façon d’analyser ces tags.

– Du coup, est-il possible de récupérer l’ID et le nombre de références prises en compte dans la construction de ces clusters?
– Sinon, lorsque nous utilisons le heatmap, à quoi correspond l’échelle à droite de la carte obtenue.

Merci d’avance pour votre réponse
Mélanie

2 Answers
Jean-Philippe Cointet Staff answered 6 years ago

En fait, il est normal de retrouver des entités très rare comme étiquettes de cluster. Une institution n’apparaissant qu’une fois aura un score de spécificité très important avec le cluster sur lequel l’article correspondant se projette. Pour éviter ces biais statistiques il est donc recommandé de d’abord préparer une liste d’institutions réduites qui contribuent à un nombre significatif d’articles dans l’ensemble du corpus.

Jean-Philippe Cointet Staff answered 6 years ago

L’échelle à droite correspond à l’échelle de mesure choisie lors du calcul de la heatmap (chi2, tf, etc.)