Source: REVUE DU PRATICIEN MEDECINE GENERALE
Auteur: Philippe Eveillard
Article paru le : Mardi 27 Mars 2007
Lancé à la fin 2004, Google Scholar est la version « universitaire » de Google. Cette version rassemble des articles, des thèses et des ouvrages en provenance des éditeurs, des sociétés savantes et des universités.
Très critiqué au début pour le mystère qui entourait ses « sources » (la liste des éditeurs en particulier), Google Scholar s´est bonifié avec le temps tout en gardant son mystère. Il y a du « très bon » dans Google Scholar, mais aussi beaucoup « d´à peu près ». En fin de compte, que faut-il en penser… ?
Les atouts majeurs sont : originalité et utilisabilité. Son originalité tient en 3 mots : citation, liens et export. Son utilisabilité est un héritage de Google.
Comme Scopus et Web of Science, Google Scholar indique le nombre de fois où un article est cité et affiche la liste des articles « citant » d´un clic de souris sur le lien « Cité… fois ».
Note : la mention [citation] est attribuée à des articles auxquels d´autres articles font référence, mais qui ne sont pas disponibles en ligne.
Si vous interrogez Google Scholar à partir d´une bibliothèque qui collabore avec l´outil de recherche, les articles affichés à la suite d´une requête et disponibles dans la bibliothèque apparaissent sous la forme d´un lien « find it @... ». Prochainement, à la suite des accords passés avec le Service universitaire de documentation (Sudoc), vous pourrez localiser les articles affichés à la suite d´une requête dans les bibliothèques appartenant au réseau du Sudoc.
Google Scholar vous propose d´exporter les références que vous avez sélectionnées dans les principaux gestionnaires de données bibliographiques (EndNote ; Reference Manager). Pour cela, vous devez sélectionner votre gestionnaire dans la page « Preferences Scholar ».
L´extrême dépouillement de la page d´accueil de Google Scholar mérite d´être souligné. Résumée à une fenêtre d´interrogation, cette page affiche clairement son usage : la requête.
Le « moins bien » est inhérent au principe de base de Google Scholar (et de Google) : l´interrogation de l´outil de recherche se fait en langage courant, en « allant à la pêche » aux pages renfermant les mots clés entrés dans la fenêtre. En clair : tous les mots d´une page sont les mots clés qui caractérisent le texte de la page ; il suffit d´entrer l´un quelconque de ces mots dans la fenêtre d´interrogation de Google Scholar pour afficher cette page.
Les 2 modules de recherche proposés par Google Scholar reprennent en grande partie la syntaxe de Google.
De tous les outils de recherche de la Toile, Google Scholar (comme Google) est celui qui a la syntaxe la plus élémentaire. Celle-ci tient en 3 mots : opérateurs booléens, troncature, mots composés.
Dans Google Scholar, les opérateurs booléens sont virtuels car OR et NOT ne sont pas sollicités dans les requêtes courantes et AND se résume à un espace (AND = un espace). La troncature est inexistante, ce qui peut être considéré comme un handicap majeur. Enfin, les mots composés (embolie pulmonaire) et les expressions (chirurgie du syndrome du canal carpien idiopathique ) sont mis entre guillemets pour que les requêtes les prennent en compte en tant que mot composé et expression.
Ce module permet de formuler des requêtes complexes en renseignant les différentes fenêtres mises à votre disposition dans son formulaire. Certaines de ces fenêtres vous facilitent la gestion des opérateurs booléens : « tous les mots » pour AND ; « au moins un des mots suivants » pour OR ; aucun des mots suivants » pour NOT. En réalité, seules les fenêtres « tous les mots suivants » et « expression exacte » présentent un intérêt car les OR et les NOT ne sont qu´exceptionnellement sollicités dans les requêtes habituelles.
Les 4 autres fenêtres sont des limites que vous imposez à votre requête : limites de date, de publication, d´auteur et de localisation des mots clés dans le titre de l´article.
Google Scholar a un gros défaut : il s´entoure de mystères à propos de ses sources et du classement de ses résultats.
Google Scholar n´a jamais publié la liste des éditeurs ni des archives ouvertes auprès desquels il se « sert » pour alimenter sa banque de données. On ne sait rien non plus de la période couverte ni de « l´actualité » de son référencement. En France, le fonds documentaire de l´Inist (banque de données Pascal) fournit ses notices à Google Scholar. Il en est de même de l´archive ouverte du Centre pour la coordination scientifique directe (Hyperarticle en ligne ou HAL).
Le « page rank » (l´algorithme de classement de Google) a ses « coins d´ombre ». On sait qu´il fait la part belle à la popularité des pages, mais on n´en sait pas beaucoup plus. Google Scolar ajoute un nouveau critère au « page rank » de Google : le nombre de citations. C´est une façon d´épaissir le mystère. Heureusement, il a décidé il y a quelques mois d´ajouter un lien dans sa page de résultats (« articles récents »), qui est la meilleure idée qu´il ait eue depuis son lancement. Dans une banque de données bibliographiques, le meilleur classement est le classement chronologique inverse. Ne manquez pas de le solliciter dans Google Scholar en cliquant systématiquement sur « articles récents ».
- Les 2 outils de recherche sont interrogés le 17 mars 2007 sur la maladie de Sever (ostéochondrite du calcanéum chez le jeune sportif). Google Scholar est interrogé à l´aide de l´équation « Sever´s disease » PubMed, ce qui revient à rechercher tous les documents qui contiennent à la fois les mots Sever´s disease et PubMed. Cette interrogation affiche 16 ressources dont 9 seulement « liées » à PubMed.
- PubMed/MEDLINE est interrogé à l´aide de l´équation Sever´s disease [tw], ce qui revient à rechercher le mot Sever´s disease dans le bordereau d´indexation des notices de MEDLINE.
Cette requête affiche 18 ressources.
- Dans Google Scholar, la requête « Sever´s disease » PubMed recherche les articles sur la maladie de Sever hébergés dans PubMed. En réalité, Google Scholar n´en affiche que quelques uns, mais affiche aussi des pages où figure le mot PubMed sans rapport avec un quelconque hébergement dans la banque de données.
- La différence entre le nombre d´articles indexés dans PubMed (18) et le nombre de liens avec une notice de PubMed dans Google Scholar (9) est nettement à l´avantage de PubMed. Ce qui signifie (en première approximation) que Google Scholar n´a trouvé que la moitié des articles recensés par PubMed.
- L´article le plus récent de PubMed date de 2006 et provient de « American Family Physician ». Il est en accès libre (en texte intégral). Il ne figure pas dans la liste de Google Scholar.
- L´article le plus récent de Google Scholar date de 2006 et provient du « Scandinavian Journal of Medicine & Science in Sports ». Il ne figure pas dans la page de résultat de PubMed/MEDLINE, bien qu´il soit indexé dans la banque de données (vérification faite avec le service « Single Citation Matcher »). L´explication est simple : le mot Sever´s disease n´est pas dans le bordereau d´indexation de la notice de l´article (donc ni dans le titre, ni dans le résumé). À juste titre, puisque son thème central concerne les douleurs du tendon d´Achille.
- L´article le plus récent de Google Scholar (2006) arrive en 2e position dans le classement « articles récents), mais en 15e position (sur 16) dans le classement « tous les articles ».
PubMed est à son avantage dans tous les « compartiments » de la requête :
– meilleur résultat obtenu quant au nombre et à l´adéquation des références ;
– classement plus cohérent des notices affichées dans la page de résultat.