Bonjour
Dans un corpus Factiva, quelle est la différence entre text et articletext ?
Merci
1 Answers
Bonjour,
Sur Factiva, voici les champs “classiques” pour faire des recherches dans le texte :
- HLP : Headline/Lead Paragraph Group (Includes Section, Column, Headline, Correction and Lead Paragraph Fields)
- TD : Text following the lead paragraphs
Ces deux champs incluent donc l’ensemble des éléments “purement” de texte des articles collectés.
Une fois dans le Manager, ces deux champs sont traduis par :
- Headline (titres des articles) première partie du HLP;
- LeadParagraph (chapeaux des articles) seconde partie du HLP;
- Text (le contenu des articles, hors titre et chapeau) qui correspond au TD.
A l’usage, nous avons ajouté un dernier champ : article_fulltext qui réuni l’ensemble des trois précédentes informations pour avoir tout le contenu des articles accessible dans un seul lieu.
En espérant que cela aide !
L