Mélange epic epoch

lise.frappier asked 6 years ago

Bonjour
J’ai voulu faire une liste d’auteurs dans le temps avec le script epic epoch.
Je découvre un auteur qui a commencé à publier en 2011 dans la liste sous 1990 et 2000 et un qui n’a qu’une publi en 1976 dans toutes les listes.
J’avais pourtant compris que l’objectif était d’identifier les plus occurrents décomposé sur la période ?
vendredi c’était très lent, j’ai pensé à pb technique mais j’ai re-testé ce matin = même résultat.
description du corpus : import de plain text wos / sous corpus sur une WC avec query
choix de paramétrage du script : champ author / dynamics : 5 slices / regular
Merci de votre aide
Lise

Jean-Philippe Cointet Staff replied 6 years ago

Le script epic epoch sélectionne montre les N entités d’une champ donné les plus fréquentes pour chaque période. La visualisation finale peut donc très bien faire apparaître plus de N entités (et c’est même très probable!)
Une formation était organisée vendredi, et encore un cours ce matin, ça explique sans doute les ralentissements constatés

lise.frappier replied 6 years ago

OK merci
mais est-ce que ça explique ça : un auteur qui a publié en 1976 apparait en 2000 et 2010.

Jean-Philippe Cointet Staff replied 6 years ago

oui, même s’il n’a pas publié par la suite, il figure dans la liste des entités suivies et epic epoch montre son volume de publication sur toute la période considérée !

lise.frappier replied 6 years ago

Je suis désolée d’insister mais ça ne fait pas sens pour moi…
L’auteur a 1 publi en 1976 sur 2100 refs dans mon sous corpus il apparait dans toutes les périodes.
Comment j’explique ça quand je décris le graph à mes collègues ? Ils vont me dire immédiatement que ça ne correspond pas à la littérature qu’ils connaissent.

3 Answers
Lionel Staff answered 6 years ago

Bonjour Lise,
Si vous voulez, vous pouvez m’ajouter comme collaborateur sur le projet en question (l.villard [@t] esiee.fr). Pour mieux comprendre, j’aimerais jeter une œil aux données.
L

lise.frappier replied 6 years ago

C’est fait.
Merci de ton aide.
Lise

Lionel Staff answered 6 years ago

En effet, comme indiqué précédemment, le comportement décrit correspond à ce qui est attendu.
Les auteurs sélectionnés figurent bien sur les périodes construites mais, en revanche, lorsqu’ils n’ont pas de valeur (de document, comme pour l’auteur mentionné) pour une période donnée, ils sont en bas de la liste et aucun lien n’y valeur ne leurs sont associés.
Ils figurent donc dans le graph final sans valeur associée pour s’assurer que s’il était publiant à nouveau, un lien serait créé avec la période précédant (le lien étant sans valeur à l’une des deux bornes et débouchant une valeur à l’autre borne). Il y a d’ailleurs au moins un auteur dans ce cas dans votre graphique.
Il n’est pas impossible de modifier le graph manuellement (et de retirer certains auteurs). Il faut disposer de compétences dans la lecture du code html et svg.
Voici la procédure : page html, on repère la partie du code contenant le svg, on copie tout le code svg (avec le deux balises svg), on colle le svg dans un fichier texte vide qu’on enregistre, on ouvre le svg avec Inkscape, puis on met un fond transparent. Enfin, on modifie le svg avant de l’enregistrer. Pas si simple…
Bon courage !
L

lise.frappier answered 6 years ago

OK je comprends mieux du coup pourquoi la liste ne s’arrête pas à 10 quand on choisit ce nombre dans les paramètres.
Je comprends vite mais il faut m’expliquer longtemps… Désolée !
Dommage qu’il ne soit pas accompagné d’un fichier de données comme la plupart des scripts ça permettrait de le retravailler…
Dans l’immédiat, je n’ai pas forcément besoin de modifier le visuel puisque je suis capable d’expliquer ce qui est sur le graph.
Merci
Bonne journée
Lise

Lionel Staff replied 6 years ago

Tout à fait !

Prenons l’exemple d’un corpus découpé en deux périodes.

En sélectionnant le TOP 10 des auteurs sur chacune des périodes : en imaginant que seulement 5 des auteurs de la première période se retrouvent actifs dans la seconde et, donc, qu’il y a 5 nouveaux auteurs pour la seconde, dans la visualisation on a 15 auteurs listés sur les deux périodes (mais avec des auteurs inactifs représentés simplement pour suivre leurs activités et absence d’activité entre les périodes définies).