Bonjour,
Bonjour,
Je souhaiterai analyser un corpus issu du WOS sur la base des coocurrences Keyword et ISIID concaténeés. Chaque référence est associée à un cluster mais je souhaiterai faire varier ce nombre de façon a avoir un nombre de clusters réduit (entre 5 et 10, puis 15 ) et a peu prés homogène (éviter les clusters avec peu de noeuds) tout en ayant une répartition thématique cohérente au niveau des références et pas trop de références sans cluster.
J’ai utilisé distributionnel en mesure de proximité (cosine donnait des clusters avec de grosse variantions dans le nombre d’items) et je modifie le nombre de noeuds pour faire varier le résultat.
Puis je jouer sur les paramètres size community threshold (1 pour l’instant) et proximity threshold (pour l’instant 0) pour obtenir le résultat souhaité et quel est leur rôle exact?
Par ailleurs comment sont définis les intitulés des clusters svp (ce ne sont pas les 2 premiers items de chaque cluster à priori).
Merci d’avance pour vos réponses
Bonne journée
Béatrice
See the answer here: https://docs.cortext.net/question/distribution-of-a-wos-corpus-in-clusters/