"Les pages de liens... et autres alternatives"

Source : Netsources n°77, Novembre/Décembre 2008

Auteur : Béatrice Foenix-Riou

Lors d’une recherche un peu généraliste sur un moteur tel Google, il est fréquent de découvrir parmi les résultats des “pages de liens” – que l’on nomme également “signets” ou “bookmarks” –,qui rassemblent sur une page une collection de liens, vers des sites dans un domaine ou sur un sujet.

Et l’on est alors tenté de s’écrier “bonne pioche !”, tant ces pages permettent de gagner un temps considérable dans l’identification de sources sur un thème.

 

Réalisées très souvent par des experts ou des passionnés d’un domaine, ces pages peuvent également être proposées par des sites de référence (associations ou fédérations, universités...) et constituent alors une rubrique du site, que l’on repère à son intitulé (“Nos Liens”...).

Las, si la valeur ajoutée de ces pages est indéniable, leur découverte est le plus souvent due au hasard.

 

Les pages de liens sont en effet rarement référencées en tant que tel dans les annuaires et sont noyées parmi les autres résultats dans les moteurs.

 

Pourtant, certaines astuces peuvent permettre de repérer spécifiquement ces pages. Certes, il ne s’agit ici que “d’astuces” – toutes les pages identifiées ne seront pas des pages de liens et toutes les pages de liens ne seront pas identifiées –, mais ces méthodes ont fait leurs preuves et rencontrent d’ailleurs un franc succès lorsque nous les présentons lors de nos formations...

 

Nous illustrerons leur intérêt en tentant de répondre à la problématique suivante : “Comment identifier une liste de sites offrant un réel contenu, dans le domaine de l’énergie solaire”.

 

Interroger un moteur comme Google avec des mots comme “énergie solaire” permet bien sûr de repérer, de-ci, de-là, quelques pages issues de sites pertinents, mais la méthode est hasardeuse puisqu’elle permet d’identifier les PAGES contenant l’expression “énergie solaire”, mais en aucun cas les SITES spécialisés sur ce domaine.

Pour preuve, le premier résultat de Google est la page de Wikipédia traitant du sujet ; cette page fournit indéniablement un certain nombre de renseignements utiles, mais elle ne mérite pas pour autant de figurer dans une “webographie” des sites à retenir...

 

C’est lorsque l’on doit répondre à ce type de question que les pages de liens présentent tout leur intérêt.

 

Dès lors que l’on cherche à identifier une liste de sites sur un thème – que ce thème soit généraliste ou très spécialisé –, il faut en fait avoir présent à l’esprit que quelqu’un – un expert, un étudiant, une association du domaine, etc. – a peut-être déjà fait ce recensement et l’a mis à disposition sur la Toile.

 

L’astuce consiste donc à rechercher spécifiquement non plus les pages parlant du thème en question, mais celles qui offrent un bookmark ou un recensement de sites sur le sujet.

 

Mais comment rechercher spécifiquement ces pages de liens ? Le premier conseil que l’on donnera – on pourrait le suivre, en fait, quelle que soit la recherche – est ici de prendre du recul afin de “visualiser” le document que l’on aimerait obtenir, puis de tenter de décrire ce document avec une syntaxe compréhensible par le moteur...

 

LE RECUL NECESSAIRE

 

Une première phase de recul est en effet nécessaire, afin de définir précisément les caractéristiques de ce que nous souhaitons obtenir.

 

Dans cet exemple, nous recherchons une page proposant une liste de sites dans le domaine de l’énergie solaire. Qu’est-ce qui peut caractériser une telle page ?

- l’expression “énergie solaire” doit être obligatoirement présente ;

- il doit y avoir un certain nombre de liens vers des sites du secteur.

 

Si la première caractéristique ne pose aucun problème quant à sa formulation – encore faudra-t-il penser aux diverses options possibles –, la seconde en revanche est plus délicate.

 

Pour la formuler, nous avons élaboré deux méthodes – déjà utilisées au sein de la rubrique Méthodologies de Netsources –, chacune tirant parti des possibilités d’un moteur.

 

RECHERCHE SUR LE TITRE ET L'URL AVEC GOOGLE

 

La première méthode s’appuie sur une constatation : les pages de liens proposées sur les sites sont très souvent incluses dans une rubrique intitulée simplement Nos liens, ou Nos signets... Un clic sur cette rubrique affiche la page en question et il arrive alors que celle-ci contienne, dans son URL ou dans son titre, le mot liens ou signets.

 

Bien évidemment, la présence du mot liens dans le titre ou dans l’URL n’est pas obligatoire. Il se trouve simplement que de nombreux éditeurs choisissent ce mot comme titre de leur page ou que le chaînage de navigation dans leur site explique la présence du mot dans l’URL.

 

Mais comme il n’existe aucune norme sur le sujet, on peut tout aussi bien trouver les mots liens, bookmark, signets (au singulier ou au pluriel) ... ou n’en trouver aucun.

 

Partant de cette constatation, nous utilisons les fonctions avancées des moteurs pour rechercher les pages qui contiennent précisément le ou les termes de la requête ET le mot liens (ou lien ou bookmark ou signets...) dans le titre OU dans l’URL. Bien évidemment, si l’on recherche des pages en anglais, on utilisera les mots links (ou link, bookmark...) en complément des mots-clés...

 

Dans notre cas, la requête sur Google devra donc contenir :

  - les mots-clés liés au thème de la recherche : les mots “énergie solaire” seront écrits entre guillemets* pour que seule l’expression soit recherchée, et l’on pensera à utiliser - les formes singulier OR pluriel ;

  - la “formule magique” pour identifier des pages de liens, notre préférence allant vers intitle:liens OR inurl:liens ; le mot liens (au pluriel) est en effet celui qui est le plus fréquemment utilisé mais, selon les résultats, il ne faudra pas hésiter à modifier cette formule en remplaçant – ou en rajoutant – intitle:signets OR inurl:bookmark OR....

 

La requête “énergie solaire” OR “énergies solaires” intitle:liens OR inurl:liens obtient 13 100 résultats (annoncés...).

 

On trouve parmi les premiers la page de liens de la Société d’Energie Solaire, des “Liens vers toutes les énergies solaires et renouvelables” proposés par le réseau solidaire des énergies, ou encore un très précieux Annuaire de l’énergie solaire en France, qui offre une description de plus de 3 000 sites du domaine, classés par rubriques (organismes, associations, médias, économie...).

 

On aurait pu aussi affiner encore la requête, en limitant la recherche du mot-clé aux seuls titres des pages. Dans ce cas, il faut impérativement penser à utiliser les formes accentuées et non accentuées des mots, puisque Google effectue alors une recherche sur leur occurrence exacte (voir Netsources n°74).

 

Pour être exhaustif – et, au regard du nombre de résultats relativement limité, il est important de l’être –, il faudra écrire :

intitle:“énergie solaire” OR intitle:“énergies solaires” OR intitle:“energie solaire” OR intitle:“energies solaires” intitle:liens OR inurl:liens.

81 résultats sont annoncés et semblent très pertinents. Cela étant, la limitation des mots-clés aux titres des pages n’est pas forcément à conseiller dans ce cas précis, car elle réduit le nombre de réponses de façon trop drastique.

 

TIRER PARTI DE LA FONCTION LINKDOMAIN: DE YAHOO!

 

Autre méthode, autre moteur...

 

L’une des caractéristiques des pages de liens est – c’est une lapalissade – la présence de nombreux liens pointant vers d’autres sites (autrement dit, la présence de nombreux liens “sortant”).

 

Pour “traduire” cette caractéristique en une syntaxe compréhensible par le moteur, nous pouvons tirer parti des opérateurs link: ou linkdomain:.

 

Rappelons que ces opérateurs permettent d’identifier “l’inverse” des pages de liens, à savoir les liens qui pointent vers une page donnée (autrement dit les “backlinks” d’une page, ses liens “entrant”).

 

Pour cette méthode précise, nous utilisons Yahoo! car ses opérateurs linkdomain: (backlinks d’un site) et link: (backlinks d’une page) fonctionnent extrêmement bien quand, bizarrement, la fonction link: chez Google ne donne que des résultats très partiels. Yahoo! d’autre part permet de combiner ces opérateurs avec des mots-clés, quand link: sur Google ne peut être employé que seul.

 

Partant de là, nous allons chercher à identifier sur Yahoo! les pages qui contiennent :

  - les mots-clés liés au thème de la recherche (ici : "énergie solaire" OR "énergies solaires") ;

  - le mot liens ;

  - un ou deux liens vers des sites de référence (que l’on aura identifiés préalablement).

Ceci dans l’espoir que de telles pages ne se contentent pas de deux liens, mais en offrent beaucoup plus...

 

Sur Yahoo!, la requête "énergie solaire" OR "énergies solaires” liens linkdomain:ademe.fr linkdomain:portail-solaire.com obtient 85 résultats, extrêmement pertinents.

 

On trouve en particulier la page de l’Institut national de l’énergie solaire (Ines), qui recense un très grand nombre de ressources en France et à l’international, classées par catégories (organismes d’Etat, pôles régionaux, annuaires, revues solaires, lettres d’infos, portails solaires, production...).

 

Il est a noter que cette méthode sur Yahoo! est complémentaire de celle sur Google, car elle permet d’identifier des pages de liens qui ne contiennent pas forcément le mot liens dans leur titre ou leur URL (c’est d’ailleurs le cas pour la page de l’Ines).

 

Comme on le voit dans cet exemple, les pages de liens sont un moyen simple et rapide d’identifier une liste de sites sur un sujet.

 

Ce n’est bien sûr pas le seul moyen. Pour une problématique de ce type, les annuaires demeurent des outils fort utiles.

 

Ainsi, différentes familles d’annuaires auraient pu être utilisées pour répondre à notre question.

 

INTERROGER UN ANNUAIRE D'ANNUAIRES,

POUR IDENTIFIER DES ANNUAIRES THÉMATIQUES

 

Le domaine de l’énergie est vaste et porteur et il existe de multiples sites sur le sujet. Il est donc probable qu’il existe également des annuaires dédiés à ce thème. Nous en avons d’ailleurs repéré un lors de la recherche de pages de liens (Portail solaire - Annuaire de l’énergie solaire en France).

 

La difficulté est bien sûr de les localiser.

 

Plusieurs méthodes peuvent permettre de les repérer, mais l’une des plus simples est d’interroger un “annuaire d’annuaires”, tel que Lesannuaires.com.

 

Relativement grand public, cet annuaire d’annuaires recèle pourtant des “pépites” et permet de repérer aisément quelques sites précieux, qui auraient été noyés parmi les autres dans les annuaires généralistes.

 

Lorsque l’on interroge un “annuaire d’annuaires”, la recherche doit être aussi large que possible. On peut donc utiliser le terme “énergie”, sachant qu’un annuaire couvrant ce thème aura sûrement une rubrique réservée à l’énergie solaire.

 

Une recherche sur Lesannuaires.com avec le mot “énergie” affiche une liste de plusieurs annuaires et permet de constater qu’il existe une catégorie “Energies”. Celle-ci recense 14 annuaires dédiés à ce thème, plusieurs étant centrés sur l’énergie solaire.

 

On retrouve notamment Portail Solaire et le site de l’INES, ainsi que d’autres ressources.

 

UTILISER UN ANNUAIRE GENERALISTE

 

Pour ce type de question, on peut aussi utiliser des annuaires généralistes, tel l’Open Directory (www.dmoz.org). Une requête avec l’expression “énergie solaire” obtient une liste de 36 sites et des rubriques à explorer comme World: Français: Commerce et économie: Energie...

 

L’Open Directory effectuant sa recherche de façon stricte, on prendra garde ici à écrire les mots de façon accentuée.

 

Afin d’être le plus large possible dans son identification, il faudra également penser à employer les formes singulier et pluriel des mots. Pour cela, on peut utiliser la troncature – l’Open Directory est l’un des rares outils qui la supporte –, mais celle-ci ne peut être combinée avec l’emploi des guillemets...

 

On lancera donc la recherche avec les mots énergie* solaire*, ce qui permettra d’identifier les descriptions de sites contenant l’expression au pluriel ou au singulier, mais aussi celles contenant les mots non côte à côte.

 

Dmoz identifie alors 72 sites – dont un “Annuaire des cabinets spécialisés en économies en énergie et énergies renouvelables: solaire, géothermie...”– et des rubriques comme World: Français: Société: Nature et environnement: Energie.

 

Dans notre exemple, Dmoz nous a permis d’identifier aisément une liste de sites concernant l’énergie solaire. Mais l’arborescence est trop généraliste et les sites offrant un réel contenu sont noyés au milieu des autres.

 

Sur ce sujet, l’annuaire thématique répondra mieux, car il pourra avoir une arborescence mieux adaptée (Portail solaire par exemple propose des rubriques comme Médias, Listes de liens...).

 

DES REPERTOIRES SELECTIFS, POUR REPERER

LES SOURCES A VALEUR AJOUTEEE

 

Pour repérer spécifiquement les sites à fort contenu, on aurait pu enfin consulter un répertoire sélectif.

 

Réalisés le plus souvent par des bibliothèques ou des universités, ces répertoires ne recensent que des sources à valeur ajoutée. Leur couverture est malheureusement plus anglophone que francophone...

 

Une recherche avec les mots “solar energy” sur Intute.ac.uk identifie 187 ressources, dont le site de la Solar Energy Society (UK-ISES), celui du Solar Energy Laboratory (SEL) : University of Wisconsin-Madison, etc.

 

Il est possible de limiter la sélection selon le type de documents : banque de données bibliographique, blogs, conférences, publications, statistiques, etc.

 

En conclusion, lorsqu’il s’agit d’identifier une liste de sites web sur un thème, quel qu’il soit, plusieurs méthodes peuvent s’avérer bien plus fructueuses que la recherche simple sur un moteur :

 

  - les pages de liens restent la piste que nous suivons le plus fréquemment, dès lors que le nombre de résultats sur le moteur est trop important ;

  - les annuaires généralistes demeurent incontournables dans certains cas, en particulier lorsque les sites à identifier doivent être situés dans un pays donné ;

  - les répertoires sélectifs s’avèrent souvent précieux pour identifier des sites qui enrichiront son bookmark ;

  - les annuaires thématiques enfin pourront permettre, par exemple, d’identifier aisément les professionnels d’un domaine.

 

*Bizarrement, mais l’on s’attend à tout de la part de Google (voir “Les approximations de Google”, Netsources n°74), le moteur annonçait, le jour de nos tests, 1 290 000 résultats quand les mots étaient écrits sans guillemets, et 2 950 000 quand c’est l’expression qui était recherchée ! Démonstration flagrante – s’il en était besoin – que le nombre de résultats indiqué par Google ne veut strictement rien dire !













 
















Vous voyez une version text de ce site.

Pour voir la vrai version complète, merci d'installer Adobe Flash Player et assurez-vous que JavaScript est activé sur votre navigateur.

Besoin d'aide ? vérifier la conditions requises.

Installer Flash Player