corpus explorer

Mtt asked 7 years ago

Bonjour,
je rencontre un problème depuis quelques jours dans l’import d’un corpus sur le manager, notamment avec Corpus Explorer.
J’ai extrait un corpus du WoS -> save to other file format -> full record and cited references , format “Plain text”. je l’ai ouvert avec Word, en laissant à l”ouverture la configuration de default en format UTF8, et je l’ai sauvegardé sous format txt. Après, j’ai compressé ce fichier avec WinZip.
Quand je fais l’upload du corpus, je laisse la configuration dataset, format ISI et ignore entries.. YES. Une fois lancé le data parsing il n’y a pas d’erreurs, mais mais si je lance le script Corpus Explorer seulement une ligne est affiché. De même avec les autres script, c’est comme si dans le corpus il y avait une seule référence.
Je ne sais pas s’il y a un problème de compatibilité, j’ai un Mac, mais j’ai essayé aussi avec des PC windows et avec différents navigateurs internet. J’ai déjà utilisé cortext avec des bases de données en format différent, mais j’aimerai quand même utiliser le plain text..
Merci si quelqu’un peux m’aider!
MTT

1 Answers
Jean-Philippe Cointet Staff answered 7 years ago

Bonjour,
je crois comprendre la source du problème, il ne faut surtout pas éditer les fichiers téléchargés depuis le WOS avec word (ni avec aucun logiciel)!
Le format risque de s’en trouver transformé…