Accueil Presse écrite Radio Photos Formations
Recherche dans ce siteLiensPour m'écrireQui suis-je ?English with GoogleDeutsch mit GoogleEspañol con Google

Moteur ou annuaire,
quel outil pour quelle recherche ?


Faites un test : demandez à un ami internaute, même très expérimenté, de citer les moteurs de recherche qu'il utilise, il y a de fortes chances que Yahoo! fasse partie de sa liste. Pourtant, Yahoo! n'est pas un moteur de recherche mais un annuaire. Cette erreur, en apparence anodine, est la source de beaucoup de frustration et de temps perdu. Savoir choisir le bon outil est essentiel pour mener une enquête approfondie ou faire une recherche de base sur Internet. Qu'est-ce qu'un moteur ? Qu'est-ce qu'un annuaire ? Comment les distinguer ? Pourquoi utiliser l'un plutôt que l'autre ? Quels sont les différents types de moteurs et d'annuaires ? Voici les réponses aux questions que la plupart des gens ne se posent pas et qui feront de vous un as de la recherche d'informations sur Internet.

Seul point commun : ce sont des bases de données.

Un moteur de recherche est une base de données constituée automatiquement par des machines et qui renferme le contenu intégral de pages web. On consulte cette base à l'aide de mots-clés. Exemples : Google, Voilà, Altavista, HotBot, Lycos.

Un annuaire est aussi une base de données. On l'appelle également « répertoire », « catalogue » ou « guide ». Mais, contrairement à un moteur de recherche, cette base de données est constituée manuellement par des humains et ne renferme qu'une très courte description de sites web (et non pas de « pages » web). On l'interroge avec des mots-clés ou en cliquant sur les catégories, sous-catégories, sous-sous-catégories, etc., proposées par des documentalistes qui les ont choisies et qui y ont classé ces descriptions de sites. Exemples : Yahoo!, Nomade, Open Directory.


Première différence
très importante : la taille des bases de données ou « index ».

Google, le moteur de recherche le plus populaire et le plus gros index à l'heure actuelle, contient plus de 2 milliards de « pages web » (la taille réelle du web, difficile à évaluer, serait d'au moins mille milliards de pages).  La version française de Yahoo! contient la description générale d'environ 135 000 « sites web ».

Pour comprendre la distinction entre un site et une page, il faut voir un site web comme un livre : il contient plusieurs pages, la page couverture étant la page d'accueil. Chaque page correspond à ce qui s'affiche sur votre écran quand vous cliquez sur un lien.


Deuxième différence
 : le contenu recensé par ces bases de données n'est absolument pas le même.

Les annuaires contiennent des descriptions générales (en quelques mots) de « sites » web et les moteurs, des pages web entières. Un annuaire ne recensera pas, par exemple, ce qui est écrit au 7ième paragraphe de la 82ième page d'un site. Mais le moteur le fera.


Entrez « Club de la presse » dans Yahoo! France, et vous n'obtiendrez que des sites web dont la description elle-même ou la catégorie (par exemple : Actualités et médias > Journalisme > Associations et organismes) dans laquelle elle se trouve contient les mots-clés « Club de la presse »  :
  • Club de la presse (Le)  - Association de journalistes de l'Hérault.
    http://perso.wanadoo.fr/clubpresse.mpl/
    Dans la catégorie :  Exploration géographique > Pays > France > Régions > Languedoc-Roussillon > Départements > Hérault (34) > Villes > Montpellier >  Actualités et médias

  • Club de la presse Saint-Étienne / Loire  - Annuaires des clubs de la presse, brêves et événements.
    http://www.club-presse-loire.com/
    Dans la catégorie :  Exploration géographique > Pays > France > Régions > Rhône-Alpes > Départements > Loire (42) > Villes > Saint-Étienne >  Actualités et médias

  • Club de la presse Val de Loire (Le)  - Association des journalistes en région Centre : revue de presse régionale hebdomadaire, annuaire des adhérents, agenda des conférences de presse.
    http://www.club-presse-valdeloire.com/
    Dans la catégorie :  Exploration géographique > Pays > France > Régions > Centre > Départements > Indre-et-Loire (37) > Villes > Tours >  Actualités et médias

Essayez « Club de la presse » dans Google, et vous obtiendrez une énumération de pages, même enfouies au plus profond d'un site, où les mots-clés apparaissent parfois dans un contexte surprenant :

Les moteurs, donc, contiennent surtout des « pages web », c'est-à-dire des fichiers informatiques qui se terminent par « .htm » ou « .html ». De plus en plus, des moteurs comme Google indexent aussi d'autres types d'informations, comme les fichiers Word, PDF (très utile pour retrouver, par exemple, des communications scientifiques ou des publications de chercheurs du monde entier), Excel, RTF, ou Powerpoint. Plusieurs enregistrent aussi les images et les sons (musiques, reportages radio, etc.). Google Recherche d'Image possède plus de 250 millions d'images dans sa base de données.

Troisième différence : le mode de constitution de ces index.

L'index du moteur Google est fabriqué par 5000 ordinateurs connectés à Internet jour et nuit. Ils visitent et enregistrent des millions de pages chaque jour et il leur faut moins d'un mois pour retourner sur les 2 milliards de pages déjà indexées,  noter les changements éventuels et rafraîchir la base de données.

L'index de Yahoo! France est fabriqué par. 12 personnes. Chacune ne peut recenser que 40 nouveaux sites par jour. De plus, les cyberdocumentalistes de Yahoo! dorment la nuit et insistent pour manger le midi. Mais ils ont un grand avantage sur les machines : ils sont intelligents, eux. Au contraire des machines, ils n'avalent pas aveuglément tout ce qui leur tombe sous la dent. Les humains valident et classent de manière logique les sites qui leur sont proposés.

Comment distingue-t-on un moteur d'un annuaire ?


Accueil | Presse écrite | Radio | Photo | Formations | Perso | Liens | Email | English | Deutsch | Español | © 2003
     Chercher sur ce site:  Recherche avancée
Google