Web of Science (WOS) Corpus | Expert query | SQL | Sub corpus

CorText Manager Q&A forumCategory: Data processingWeb of Science (WOS) Corpus | Expert query | SQL | Sub corpus
PrJohnsen asked 5 years ago

Est-ce possible d’avoir un exemple d’une query « expert » afin de générer un subcorpus ?

Dans mon cas se serait une chose comme:

SELECT * FROM xxx WHERE xxx not in (xxx).

Je souhaite exclure certains articles (j’ai une liste de DOI).

Il s’agit des articles avec un consortium d’auteurs comme par exemple : http://apps.webofknowledge.com/full_record.do?product=WOS&search_mode=GeneralSearch&qid=2&SID=4E3RnSOvN3FAqMBaHLm&page=1&doc=1

Sauf s’il existe un meilleur moyen de les exclure… maybe avec un LENGTH() < xxx

Merci pour votre aide !

2 Answers
Lionel Staff answered 5 years ago

Bonjour,

Oui, c’est possible. Il y a plusieurs manières de faire. Par le script query « expert », il faut fonctionner en deux temps :

  1. construire une requête SQL qui va identifier les articles à inclure et ceux à exclure, en créant en nouvelle table (variable)
  2. puis sélectionner à nouveau le script query (mais non expert) en, cette fois-ci, choisissant la nouvelle variable crée en 1
  3. préciser dans la condition la valeur a inclure. Ex : Condition : DATA = “inclure”
Lionel Staff answered 5 years ago

1/ Dans le script query, choisir expert et ajouter la requete suivante :

CREATE TABLE Keywords_custom_doi AS 
SELECT file, id, rank, parserank, CASE ("data") 
WHEN "10.1162/jocn.2008.20012" 
THEN "exclure" 
WHEN "10.1016/j.jengtecman.2009.11.001" 
THEN "exclure" 
ELSE "conserver" 
END AS data 
FROM isidoi

Voir ici : https://gist.github.com/lvillard/a337bd93526a3141d47fe4c836491ecd

2/ retourner dans le script query, puis dans [target table name], choisir la nouvelle variable (table), ici [Keywords_custom_doi], et préciser dans la condition [data = ‘conserver’] pour exclure tous les DOI précédemment lister.

Nommer le nouveau corpus [Output table/bdd name : MonNouveauCorpus]

Attention à bien utiliser les bonnes guillemets (simples ou doubles).

En espérant que ça aide !

Lionel