Comme précédemment, je dispose d’un corpus d’articles extrait du WOS.
Lorsque l’on exécute le script Network mapping…
- First Field: Keywords (auteurs)
- Second Field: Keywords (auteurs)
- Community detection algorithm: louvain
…est généré un fichier maps_output.zip qui contient un fichier maps\maps_export_format\clusters\cluster.csv
Ce fichier contient une colonne weight. Son résultat vient du calcul de la modularité de l’algo louvain ?
J’ai très peu de valeurs situées au-dessus de 0.3, seuil au-delà duquel on peut considérer que l’on a une structure communautaire significative ? Elles tendent globalement tous vers 0. Ce qui revient à se rapprocher d’un partitionnement d’un graphe aléatoire non ?
D’autre part, j’aimerais savoir à quelles valeurs est rattachée la taille des triangles sur le PDF final. Dans le fichier . GEFX généré il y a une colonne weight avec des entiers (il s’agit de la somme des liens entrants et sortant ? ) est-ce lui qui donne la taille au triangle ?
Merci
Le paramètre weight ne vient pas de l’algorithme de Louvain qui n’a pas vraiment de correspondance à l’échelle d’un noeud unique.
Ce poids est une mesure de la centralité du terme au sein de son cluster. Il permet de labellisée les clusters mais aussi d’évaluer la stabilité temporelle d’un cluster.
Dans l’export gexf, on retrouve des “weights” à nouveau mais ils correspondent en fait à la taille des noeuds (qui est égale au nombre d’occurrences de l’entité). Gephi transforme en effet automatiquement l’attribut weight en taille de noeud. C’est la même valeur qui est utilisée pour calculer la taille des triangles dans l’export pdf
Merci pour ces éclaircissements.
J’ai une autre question, comment Gephi calcul les valeurs in-degree et out-degree dans un réseau qui est semble-t-il non dirigé ?
ça dépend tout de même des métriques, par exemple distributional produit des réseaux orientés !