"Diversifier les types de résultats obtenus"
Source : Netsources n°72, Janvier/Février 2008
Auteur : Béatrice Foenix-Riou
L’interrogation du moteur Google est aujourd’hui devenu un tel réflexe lors d’une recherche d’information que les internautes se contentent le plus souvent de ses premiers résultats, qui sont d’ailleurs généralement pertinents. D’après le baromètre Xiti 1ère Position Google représentait en France, en décembre 2007, 90,83 % des parts de visite des moteurs de recherche ! ...
Ce réflexe est somme toute un “bon réflexe”, dans la mesure où il permet à la fois de se faire une idée du nombre d’informations répondant à la question et d’obtenir quelques premiers résultats intéressants.
Pour autant, il est dommage d’arrêter là ses recherches, car d’autres voies d’exploration aboutissent quelquefois à l’identification de documents d’un autre type, pouvant se révéler très riches.
Nous l’illustrerons à travers le traitement d’une question précise : “Quelles pourraient être les pistes à suivre en Algérie, dans le domaine des énergies renouvelables”.
L’objectif de cet article n’est pas bien sûr de traiter la question en présentant les types d’énergies à développer, mais d’illustrer comment la stratégie de recherche adoptée peut influer sur les résultats obtenus.
IDENTIFIER DES DOCUMENTS DE FOND GRACE AUX MOTEURS
Les moteurs peuvent permettre d’obtenir aisément quelques documents concernant les énergies renouvelables en Algérie ; une requête sur Google avec les simples termes énergie renouvelable algérie obtient ainsi plus de 61 500 résultats.
En revanche, si l’on précise la requête en la restreignant à l’expression exacte (“énergie renouvelable” algérie), le nombre de réponses tombe à 15 200.
Il est important dans ce cas de penser à rechercher l’expression au singulier et au pluriel. La requête “énergie renouvelable” OR “énergies renouvelables” algérie obtient 37 800 résultats.
Parmi les premiers, on trouve notamment l’annonce d’une conférence sur le sujet, ainsi que des articles indiquant que le gouvernement algérien compte promouvoir les énergies renouvelables. Mais en visualisant quelques documents, on s'aperçoit vite que beaucoup traitent du sujet en quelques lignes et ne permettent guère de réaliser une synthèse sur les pistes à suivre.
Pour une question de ce type, où l’on souhaite obtenir non pas des indications générales mais des données de fond, il peut être utile de limiter la requête à certains types de documents.
Ainsi, on identifiera plus spécifiquement des dossiers ou des publications dans les fichiers PDF, des rapports dans les documents Word et des conférences au format PowerPoint.
En rajoutant filetype:pdf à la requête, on obtient 4 660 documents, parmi lesquels la présentation d’un projet national de recherche sur “Les perspectives du pompage éolien en Algérie”, le support d’une conférence sur “Les énergies renouvelables, les filières développées en Algérie”, etc.
Le rajout de filetype:doc permet quant à lui d’identifier 529 résultats, quand filetype:ppt en localise 36, particulièrement pertinents.
On trouve ainsi une présentation de 26 pages intitulée “Energies renouvelables : les perspectives algériennes à l’horizon de 2020 et les opportunités de coopération scientifique dans le cadre du NEPAD”.
On aurait bien sûr pu faire une recherche simultanée sur les différents types de fichiers – avec la requête “énergie renouvelable” OR “énergies renouvelables” algérie filetype:doc OR filetype:pdf OR filetype:ppt – mais les documents Word et PowerPoint, beaucoup moins nombreux, auraient alors été noyés parmi les fichiers PDF.
La localisation de quelques documents de fond s’avère ici relativement rapide et aisée – lorsque l’on connaît l’opérateur filetype: – et beaucoup d’internautes risquent de se contenter de ces résultats.
Pourtant, d’autres pistes peuvent être explorées et se révéler plus pertinentes.
On peut ainsi faire l’hypothèse que, sur un sujet comme les énergies renouvelables, il existe des sites spécialisés ou des banques de données – dans l’idéal situés en Algérie pour bien couvrir ce pays –, dont les résultats apparaissent mal classés dans les pages de Google, ou qui appartiennent tout simplement au Web invisible.
IDENTIFIER DES SITES SPECIALISES GRACE AUX ANNUAIRES
Si de tels sites existent, ils pourront être identifiés plus aisément avec un annuaire qu’avec un moteur.
Malheureusement, l’aspect aléatoire de la recherche demeure, car les annuaires généralistes sont en voie de disparition et que l’un des rares survivants, l’Open Directory, couvre les différents pays du monde avec plus ou moins de bonheur.
Comme pratiquement tous les annuaires, la page d’accueil de Dmoz (ww.dmoz.org) offre une série de rubriques et de sous-rubriques répertoriant les sites (près de cinq millions au total). Mais contrairement au choix qu’avait fait Yahoo!, il est possible d’accéder à tous les sites répertoriés, dans toutes les langues et dans tous les pays, depuis l’interface internationale. Il faut simplement partir de la bonne rubrique.
Car sur les seize rubriques principales proposées, quatorze listent des sites en anglais, aux Etats-Unis.
Les deux exceptions sont :
- Regional, qui permet d’accéder aux sites en anglais, dans les différents pays du monde (classement par pays) ;
- World, qui répertorie les sites dans une langue autre que l’anglais, dans le monde (choix de la langue puis du pays).
Pour l’Algérie, ces deux points de départ peuvent être utilisés.
L’arborescence Regional > Africa > Algeria recense 122 sites en anglais, classés par rubriques et sous-rubriques thématiques.
Comme on pouvait le penser, les sites en français sont bien plus nombreux et l’arborescence World > Français > Régional > Afrique > Algérie en recense 1 301.
Depuis cette catégorie, on peut alors naviguer via des rubriques thématiques, ou lancer une recherche par mots sur l’ensemble des descriptions de sites en français en Algérie, en précisant ce choix dans le menu déroulant situé à droite de la zone de saisie (uniquement dans Afrique/Algérie).
Une requête avec le simple mot énergie* identifie quatre sites (Dmoz effectuant ses recherches sur l’occurrence exacte des mots, on prendra garde à écrire la requête sous forme accentuée et à utiliser la troncature pour rechercher les formes pluriel et singulier). L’un des résultats est :
- Centre de développement des énergies renouvelables (CDER) - Présente ses activités dans le domaine des énergies thermiques, photovoltaïques, biomasse et éolienne. Bibliothèque virtuelle, événements, équipes de recherche, bulletin et revue des énergies renouvelables. Alger.
http://www.cder.dz/
World: Français: Régional: Afrique: Algérie: Enseignement et formation: Enseignement supérieur.
Dès les premiers pas de la consultation de ce site, on découvre qu’il constitue en fait un formidable gisement d’information sur le sujet.
Créé en 1988 par le Haut Commissariat à la Recherche, le CDER a pour mission d’élaborer et de mettre en œuvre les programmes de recherche et de développement, scientifiques et technologiques, des systèmes énergétiques exploitant l’énergie solaire, éolienne, géothermique et l'énergie de la biomasse.
La colonne de gauche propose ainsi l’accès à une Bibliothèque virtuelle, permettant d’interroger par mots le fonds documentaire du CDER. Ce dernier est constitué notamment :
- du résumé détaillé (depuis 1998) et/ou du texte intégral (depuis 2003) de 385 articles publiés dans la Revue des Energies Renouvelables, une revue internationale éditée par le CDER, dédiée à la présentation des travaux de recherches les plus récents sur les différentes technologies de valorisation des énergies renouvelables (solaire, éolienne, géothermique et biomasse-énergie) ;
- du texte intégral de 171 articles publiés depuis 2001 dans le Bulletin des Energies Renouvelables, une publication de vulgarisation scientifique pour les chercheurs désireux de décrire leurs projets de recherche, de définir leurs objectifs et/ou d'apporter des indications et informations d'ordre général concernant les énergies renouvelables ;
- de la référence de 370 thèses et mémoires encadrés par des chercheurs du CDER, exploitant les domaines de recherche comme la biomasse, l’énergie éolienne, l’énergie géothermique, l’énergie solaire photovoltaïque, etc. Un résumé détaillé est proposé pour les thèses les plus récentes et le texte intégral de quelques thèses est par ailleurs disponible.
Une grille de recherche avancée permet de lancer une requête par mots sur ces trois modules, en limitant au champ auteur, titre ou mots-clés.
Ce site extrêmement riche, qui recèle encore d’autres trésors, apparaît pourtant mal classé dans les résultats de Google.
S’il est cité dans quelques-unes des pages sélectionnées, la page d’accueil du CDER n’apparaît qu’en 119ème position pour la requête énergies renouvelables algérie et en 86ème position si l’on précise “énergie renouvelable” OR “énergies renouvelables” algérie !
Ce “mauvais classement” d’une source pourtant officielle et centrée sur le sujet s’explique en partie par le fait que le nombre de “backlinks” (liens pointant vers elle) est relativement faible.
La commande link:http://www.cder.dz, destinée à identifier les liens pointant vers la page www.cder.dz, n’obtient que 120 résultats sur Yahoo! et ... 17 sur Google (bizarrement, alors que la reconnaissance des backlinks est l’un des principaux éléments de son algorithme de classement, Google gère très mal la commande link:).
D’autre part, les sites gouvernementaux en Algérie n’ayant pas tous le même “top level domain” (on trouve aussi bien www.mf.gov.dz pour le ministère des Finances que www.mtp-dz.com pour le ministère des Travaux Publics ou encore www.mae.dz pour celui des Affaires étrangères), la “détection automatique” de la fiabilité de la source est plus compliquée... On touche là aux limites d’un moteur, comparativement au mode de fonctionnement des annuaires (sites indexés manuellement par les éditeurs)....
LOCALISER DES RESSOURCES GRACE AUX PAGES DE LIENS
Dans un domaine aussi large que celui des énergies renouvelables, il est raisonnable de penser qu’il existe sur le Web des pages de liens offrant une sélection choisie de sites sur le sujet.
Plusieurs stratégies peuvent permettre d’identifier ces pages de liens.
Nous avons déjà démontré dans nos articles qu’en saisissant sur un moteur les mots de la requête suivis de intitle:liens OR inurl:liens – exemple : “commerce équitable” intitle:liens OR inurl:liens –, on trouvait généralement parmi les résultats plusieurs pages de liens concernant le thème indiqué (voir Netsources n°56).
Une autre méthode, peut-être plus alambiquée mais tout aussi efficace, consiste à tirer parti de l’opérateur linkdomain: de Yahoo!*. Cet opérateur en effet permet à la fois d’identifier les liens pointant vers un site (et non vers une page, contrairement à l’opérateur link:) et de combiner cette requête avec des mots ou d’autres opérateurs.
Mais comment formuler la requête ?
D’une façon générale, lorsque l’on souhaite mettre en place une stratégie efficace, on peut procéder en deux étapes : “visualiser” le document final que l’on aimerait obtenir, puis retranscrire ses caractéristiques sous la forme d’une stratégie de recherche.
Dans notre cas, nous voulons localiser des pages de liens listant des ressources sur l’énergie renouvelable en Algérie.
De telles pages doivent donc :
- contenir obligatoirement les mots “énergie(s) renouvelable(s)” et Algérie ;
- contenir éventuellement le mot liens – on peut l’indiquer dans une première étape, puis le supprimer dans une seconde, si le nombre de résultats est trop faible ;
- offrir des liens vers des sites, comme celui du CDER par exemple.
Une requête permettant d’obtenir de telles pages peut être “énergie renouvelable” OR “énergies renouvelables” algérie liens linkdomain:cder.dz.
Cette requête obtient 153 résultats sur Yahoo!, parmi lesquels on trouve, en troisième position, une liste du “Solar Club” du CERN sur les énergies renouvelables dans les pays en développement, listant à la fois des documents de référence et des sites web.
Plusieurs pages issues de divers annuaires sont également sélectionnées, et peuvent répertorier des sites concernant l’Afrique (ou l’Algérie) ou encore les énergies renouvelables.
FAIRE UN TOUR SUR LA BLOGOSPHERE...
Les blogs peuvent apporter leur lot d’informations sur les énergies renouvelables, donner des précisions sur l’exploitation possible des différents types d’énergie, relater des expériences dans certains pays, etc. La blogosphère mérite donc à ce titre d’être explorée.
Pour identifier des blogs sur le sujet, plusieurs méthodes existent.
On peut tout simplement partir de Google, avec des mots comme “énergies renouvelables” blog. Les premiers résultats identifient de nombreux blogs en français sur ce thème, dont Le blog des énergies renouvelables (http://eole.over-blog.net), Le blog des énergies nouvelles (www.leblogenergie.com/), Sequovia blog (www.sequovia.com/blog/), etc. Il reste ensuite à interroger chacun sur la question précise de l’Algérie.
Bien entendu, la requête devra être écrite en anglais si l’on souhaite localiser des sources internationales ; on pourra dans ce cas, eu égard au nombre de résultats, limiter la question aux titres des pages (ex.: intitle:renewable intitle:energy blog ou, s’il y a trop de réponses, allintitle:energy renewable blog).
Une autre méthode, à notre avis plus pertinente, consiste à suivre la “blogroll” d’un blog de référence.
De nombreux blogueurs offrent en effet à leurs lecteurs la liste de leurs “blogs préférés”, le plus souvent dans la même thématique. Suivre ces listes permet alors de constituer très vite ses propres signets.
Le domaine des énergies renouvelables ne déroge pas à la règle et l’on peut aisément se procurer, depuis certains des blogs précédemment identifiés, une liste d’autres blogs couvrant la même thématique.
Enfin, l’interrogation de moteurs dédiés à la blogosphère identifiera les billets concernant cette thématique et permettra donc de savoir ce qui se dit sur le sujet.
En interrogeant des outils comme Google Blogsearch (http://blogsearch.google.fr) ou le module Blogs d’Ask.com (http://fr.ask.com) avec la requête "énergies renouvelables" OR "énergie renouvelable" algérie, on repère là encore des articles récents et pertinents qui n’apparaissaient pas dans les premiers résultats de Google Web. A titre d’exemple, le premier résultat de Google Blogsearch, issu du blog Riaed.net (Réseau international d’accès aux énergies durables), a pour titre “Algérie: une centrale hybride solaire/gaz naturel de 150 MW” et fait mention d’une étude récente en anglais sur le sujet, téléchargeable gratuitement..
... NE PAS OUBLIER LES AUTRES TYPES DE DOCUMENTS...
Nous avons jusqu’ici élargi la recherche aux blogs, aux pages de liens et aux sites web – et encore, nous avons limité l’exemple aux sites localisés en Algérie, mais nous aurions pu aussi chercher à identifier des portails thématiques internationaux, etc.
Pour une telle question cependant, des éléments de réponse peuvent aussi se trouver dans d’autres types de documents, comme la littérature scientifique ou les livres...
Des moteurs spécialisés tels Scirus (www.scirus.com) ou Google Scholar (http://scholar.google.fr) pourront être interrogés pour identifier des articles parus dans la presse scientifique sur le sujet.
Les possibilités de recherche du premier sont plus sophistiquées, mais le second a l’avantage de couvrir également la littérature francophone – même si cette dernière est largement minoritaire.
Une requête avec “énergies renouvelables” algérie sur Google Scholar identifie par exemple 289 documents, pour la plupart très pertinents. Si l’on trouve plusieurs documents PDF téléchargeables gratuitement – dont une thèse de doctorat soutenue en 2006 –, de nombreux résultats sont des références bibliographiques issues du Catalogue de l’Inist (voir Netsources n°63).
Dans ce cas, seule la référence est gratuite ; le texte intégral de l’article doit être commandé à l’Inist. Dans les faits cependant, ces références concernent le plus souvent des articles parus dans ... la Revue des énergies renouvelables, en accès libre sur le site du CDER....
Google Books (http://books.google.fr) quant à lui permet de lancer une recherche par mots sur le texte intégral des ouvrages numérisés (plus d’un million à ce jour).
La requête en français (“énergies renouvelables” algérie) identifie 28 ouvrages, quand la même en anglais obtient plus de 600 résultats.
Parmi ceux-ci, la plupart n’offrent à la consultation que des extraits limités – de plusieurs pages quelquefois –, mais certains peuvent être affichés (et téléchargés) dans leur intégralité, tel l’ouvrage “Perspectives économiques en Afrique”, édité par la Banque africaine de développement, ou le rapport “National energy policy; inventory of major federal energy programs and status”.
On le voit, si Google reste un moteur très pertinent, le professionnel de l’information gagnera à explorer d’autres pistes.
*On lira sur ce thème l’article “ Trucs et astuces pour un chasseur de liens”, paru dans le n° 51 de Netsources.
BFR Consultants
17 avenue Noël
94100 Saint Maur des Fossés
Tél.: 06 47 85 15 99
contact at bfr-consultants.com
www.bfr-consultants.com
