heading name in corpus

lhoste asked 6 years ago

Bonjour
Dans un corpus Factiva, quelle est la différence entre text et articletext ?
Merci

1 Answers
Lionel Staff answered 6 years ago

Bonjour,
Sur Factiva, voici les champs “classiques” pour faire des recherches dans le texte :

  • HLP : Headline/Lead Paragraph Group (Includes Section, Column, Headline, Correction and Lead Paragraph Fields)
  • TD : Text following the lead paragraphs

Ces deux champs incluent donc l’ensemble des éléments “purement” de texte des articles collectés.
Une fois dans le Manager, ces deux champs sont traduis par :

  • Headline (titres des articles) première partie du HLP;
  • LeadParagraph (chapeaux des articles) seconde partie du HLP;
  • Text (le contenu des articles, hors titre et chapeau) qui correspond au TD.

A l’usage, nous avons ajouté un dernier champ : article_fulltext qui réuni l’ensemble des trois précédentes informations pour avoir tout le contenu des articles accessible dans un seul lieu.
En espérant que cela aide !
L