Moteur
ou annuaire,
quel outil pour quelle recherche ?
Faites un test : demandez à un ami internaute, même
très expérimenté, de citer les moteurs de recherche
qu'il utilise, il y a de fortes chances que Yahoo!
fasse partie de sa liste. Pourtant, Yahoo! n'est pas un moteur de recherche
mais un annuaire. Cette erreur, en apparence anodine, est la source de
beaucoup de frustration et de temps perdu. Savoir choisir le bon outil
est essentiel pour mener une enquête approfondie ou faire une recherche
de base sur Internet. Qu'est-ce qu'un moteur ? Qu'est-ce qu'un annuaire ?
Comment les distinguer ? Pourquoi utiliser l'un plutôt que
l'autre ? Quels sont les différents types de moteurs et d'annuaires ?
Voici les réponses aux questions que la plupart des gens ne se
posent pas et qui feront de vous un as de la recherche d'informations
sur Internet.
Seul point commun : ce sont des bases de données.
Un moteur de recherche est une base de données
constituée automatiquement par des machines et qui renferme
le contenu intégral de pages web. On consulte cette
base à l'aide de mots-clés. Exemples : Google,
Voilà, Altavista,
HotBot, Lycos.
Un annuaire est aussi une base de données.
On l'appelle également « répertoire », « catalogue »
ou « guide ». Mais, contrairement à un moteur de recherche,
cette base de données est constituée manuellement par
des humains et ne renferme qu'une très courte description
de sites web (et non pas de « pages » web). On l'interroge
avec des mots-clés ou en cliquant sur les catégories, sous-catégories,
sous-sous-catégories, etc., proposées par des documentalistes
qui les ont choisies et qui y ont classé ces descriptions de sites.
Exemples : Yahoo!,
Nomade, Open
Directory.
Première différence très importante : la taille des
bases de données ou « index ».
Google, le moteur de recherche le plus populaire
et le plus gros index à l'heure actuelle, contient plus de 2 milliards
de « pages web » (la taille réelle du web, difficile
à évaluer, serait d'au moins mille milliards de pages).
La version française de Yahoo! contient la description générale d'environ
135 000 « sites web ».
Pour
comprendre la distinction entre un site et une page, il faut voir un
site web comme un livre : il contient plusieurs pages, la page
couverture étant la page d'accueil. Chaque page correspond à
ce qui s'affiche sur votre écran quand vous cliquez sur un lien.
Deuxième différence : le contenu recensé par ces bases
de données n'est absolument pas le même.
Les annuaires contiennent des descriptions
générales (en quelques mots) de « sites » web et les
moteurs, des pages web entières. Un annuaire ne recensera
pas, par exemple, ce qui est écrit au 7ième paragraphe de la 82ième
page d'un site. Mais le moteur le fera.
Entrez « Club de la presse »
dans Yahoo! France, et vous n'obtiendrez que des sites web
dont la description elle-même ou la catégorie (par exemple : Actualités
et médias > Journalisme > Associations
et organismes) dans laquelle elle se trouve contient les mots-clés
« Club de la presse » :
-
Club de la presse
(Le) - Association de
journalistes de l'Hérault.
http://perso.wanadoo.fr/clubpresse.mpl/
Dans la catégorie : Exploration géographique >
Pays > France > Régions > Languedoc-Roussillon > Départements
> Hérault (34) > Villes > Montpellier >
Actualités et médias
-
Club de la presse Saint-Étienne / Loire - Annuaires
des clubs de la presse, brêves et événements.
http://www.club-presse-loire.com/
Dans la catégorie : Exploration géographique >
Pays > France > Régions > Rhône-Alpes > Départements
> Loire (42) > Villes > Saint-Étienne >
Actualités et médias
-
Club de la presse Val de Loire (Le) -
Association des journalistes en région Centre : revue de presse
régionale hebdomadaire, annuaire des adhérents, agenda des conférences
de presse.
http://www.club-presse-valdeloire.com/
Dans la catégorie : Exploration géographique >
Pays > France > Régions > Centre > Départements >
Indre-et-Loire (37) > Villes > Tours >
Actualités et médias
Essayez « Club de la presse » dans Google,
et vous obtiendrez une énumération de pages, même enfouies au plus
profond d'un site, où les mots-clés apparaissent parfois dans un
contexte surprenant :
|
Les moteurs, donc, contiennent surtout des « pages
web », c'est-à-dire des fichiers informatiques qui se terminent
par « .htm » ou « .html ». De plus en plus, des
moteurs comme Google indexent aussi d'autres types d'informations, comme
les fichiers Word, PDF (très utile pour retrouver, par exemple,
des communications scientifiques ou des publications de chercheurs du
monde entier), Excel, RTF, ou Powerpoint. Plusieurs enregistrent aussi
les images et les sons (musiques, reportages radio, etc.). Google Recherche
d'Image possède plus de 250 millions d'images dans sa base de données.
Troisième différence : le mode de
constitution de ces index.
L'index du moteur Google est fabriqué
par 5000 ordinateurs connectés à Internet jour et nuit.
Ils visitent et enregistrent des millions de pages chaque jour et il
leur faut moins d'un mois pour retourner sur les 2 milliards de pages
déjà indexées, noter les changements éventuels
et rafraîchir la base de données.
L'index de Yahoo! France est fabriqué par.
12 personnes. Chacune ne peut recenser que 40 nouveaux sites par jour.
De plus, les cyberdocumentalistes de Yahoo! dorment la nuit et insistent
pour manger le midi. Mais ils ont un grand avantage sur les machines
: ils sont intelligents, eux. Au contraire des machines, ils n'avalent
pas aveuglément tout ce qui leur tombe sous la dent. Les humains
valident et classent de manière logique les sites qui leur sont
proposés.
Comment
distingue-t-on un moteur d'un annuaire ?
|