Retour à l'accueil
accueil renseignements diffusion
Recherche
avancée
 Numéro 35, Mai 2000 
Une trousse pour chercher efficacement dans Internet Version Imprimable  Version imprimable


Christian Dumont  (Centre collégial de formation à distance)

À l’heure actuelle, le Web abrite plus d’un milliard de documents et on estime que ce nombre doublera au cours des 18 prochains mois. Imaginez, la seule Library of Congress à Washington compte, dans son catalogue, 12 millions d’entrées ! Cette progression astronomique du Web soulève cependant un problème de taille : comment y trouver ce que l’on cherche ? De fait, selon une enquête menée à l’Université Georgia Tech en 1998, 75 % des internautes affirment que la recherche d’information constitue leur activité principale lorsqu’ils naviguent dans Internet, mais une proportion équivalente disent que leur principale frustration est, paradoxalement, de ne pas trouver dans Internet ce qu’ils cherchent !

Or, pour répondre aux exigences de leurs études et du marché du travail, les élèves du collégial doivent pouvoir tirer profit des immenses ressources disponibles dans Internet. En effet, les objectifs d’apprentissage de plusieurs cours, notamment dans les domaines de l’économie et du commerce, exigent la recherche et l’analyse de données. Or, de nombreux élèves éprouvent, à l’instar d’une majorité d’internautes, d’importantes difficultés à trouver rapidement de l’information pertinente ou ne savent pas comment évaluer la fiabilité des données ni comment les utiliser en respectant les droits d’auteur.

C’est donc pour aider les étudiants à devenir des chercheurs plus efficaces que nous avons conçu la Trousse de recherche d’information efficace dans Internet. Ce site Web, réalisé par le Centre collégial de formation à distance (CCFD) en collaboration avec le Collège des Grands Lacs, a été produit grâce à une subvention du Réseau des cégeps et des collèges francophones du Canada (RCCFC). Pour rédiger le contenu de la trousse, nous avons retenu les services de Christine Dufour et de Francis Giguère. Ils sont tous deux étudiants au doctorat en sciences de l'information et chargés de cours à l'École de bibliothéconomie et de sciences de l'information de l'Université de Montréal de même que consultants en information pour les services-conseils INFORmare.

La Trousse de recherche d’information efficace dans Internet se compose d’un guide méthodologique et d’un répertoire de sites Web. Le guide méthodologique, cœur de la trousse, expose les bases d’une recherche efficace dans Internet. Enrichi de nombreux exemples et d’exercices permettant de se familiariser avec les différents types d'instruments de recherche, le guide vise à outiller l’ensemble des élèves du collégial, facilitant ainsi leurs parcours dans les méandres d’Internet. Voyons ensemble les grandes étapes de la démarche présentée dans le guide.

Internet : une bien étrange bibliothèque
Imaginez une immense bibliothèque où l'on ne trouverait ni bibliothécaire ni catalogues. On y entrerait et on en sortirait sans aucun contrôle, libre d’ajouter ou de retirer des livres à son gré. Tel livre nous plaît, on le place sur les rayons ! Tel autre nous ennuie, on le jette ! Vous vous doutez bien que cette étrange bibliothèque aurait tôt fait de se transformer en un véritable capharnaüm.

Vous l’aurez deviné, Internet ressemble beaucoup à cette bibliothèque. Malheureusement, on n’y trouve aucun catalogue central ni même un système de classification uniforme. Pour repérer l’information, il faut s’en remettre à ce qu’on appelle des outils de recherche. Ces outils – on en recense à l’heure actuelle près de 2 500 – peuvent être regroupés en trois grandes catégories : les répertoires, les moteurs de recherche et les métamoteurs. La compréhension de leur fonctionnement est une condition sine qua non d’une recherche efficace. On ne s’étonnera donc pas de constater qu’une part importante du guide méthodologique est consacrée aux grandes familles d’outils de recherche.

Les répertoires
Revenons à la métaphore de l’étrange bibliothèque. Imaginons maintenant qu’un usager, lassé de ne jamais trouver ce qu’il cherche, décide de noter dans un calepin le titre, la description et l’emplacement d’un certain nombre de livres qu’il juge utiles ou, à tout le moins, intéressants. Eh bien, cet astucieux usager fait essentiellement le même travail que les responsables d’un répertoire qui compilent une liste de sites et les classent par thèmes. Le répertoire est assez restreint si on le compare aux autres types d’outils, mais ses données présentent l’avantage d’avoir été filtrées par ses responsables ou par ses usagers. Parmi les répertoires les plus connus, on compte Yahoo !, Britannica.com, Argus Clearingouse et la Toile du Québec.

Les moteurs de recherche
Contrairement aux répertoires, les moteurs de recherche indexent automatiquement le contenu de pages Web, ce qui leur permet de couvrir un plus grand nombre de sites. En fait, tout se passe comme si un usager de notre bibliothèque décidait de noter dans son calepin (il en faudrait plus d’un…) tout le texte des livres d’un rayon et ce, sans aucune forme de sélection. Or, puisqu’il s’agit d’un procédé complètement automatique, vous pouvez retrouver dans l’immense base de données d’un moteur de recherche, par exemple, le site officiel de la NASA… et la page personnelle de votre beau-frère passionné d’astronomie ! AltaVista, Northern Light Search, Google et Ecila sont des moteurs de recherche.

Il est utile de préciser ici que toute recherche dans Internet ne se fait justement pas dans Internet, mais plus précisément dans les bases de données des différents outils consultés. Pour reprendre une fois encore notre image de la bibliothèque, nous ne cherchons pas dans la bibliothèque, mais bien dans les calepins de quelques valeureux usagers. Or ces calepins (les bases de données) ne recensent qu’une partie de l’ensemble du contenu d’Internet. Aussi, il ne faut pas hésiter, lorsqu’on veut consulter un site peu visité, par exemple, à faire appel à plusieurs moteurs de recherche.

Les métamoteurs
Le préfixe méta signifie, notamment, ce qui englobe. Cette précision sémantique nous aide à mieux comprendre le fonctionnement des métamoteurs : ceux-ci permettent d’interroger les bases de données de plusieurs répertoires et de plusieurs moteurs. Grâce à un métamoteur, nous pouvons chercher, par exemple, à la fois dans Yahoo ! et dans AltaVista et ce, en une seule opération. Ces métamoteurs peuvent prendre la forme d’un logiciel que l’on installe dans son ordinateur (l’outil de recherche québécois Copernic, par exemple) ou, simplement, d’un site Web (C4 TotalSearch Technology et MetaCrawler). Si ces outils présentent l’avantage de ratisser une plus grande surface d’Internet, il faut cependant prendre en considération, comme le soulignent les auteurs de la trousse, le fait que l’interrogation simultanée cause un problème, car on ne peut utiliser en même temps toutes les capacités des différents outils consultés.

De la méthode avant toute chose !
En plus d’expliquer les types d’outils de recherche, le guide de la trousse propose une méthode pour mener à bien une recherche d’information en quatre étapes : la préparation, la recherche, l’analyse et la diffusion, elles-mêmes divisées en tâches. Bien que la démarche proposée puisse paraître au premier abord fort linéaire, il en va tout autrement : la recherche dans Internet demeure un processus hautement itératif. Cela est particulièrement évident à la phase d’analyse, où l’utilisateur de la trousse est amené, lorsque sa recherche se révèle infructueuse, à reconsidérer des choix effectués en début de parcours.

La préparation
Les chercheurs novices ont souvent tendance à escamoter la phase de préparation de la recherche, qui leur semble fastidieuse et peu utile. Pourtant, il s’agit là d’une étape essentielle. La première tâche consiste à déterminer le contexte dans lequel s’effectuera la recherche, en s’interrogeant sur le type d’information recherchée, le temps dont on dispose, la nature et la quantité d’information désirée. Puis vient l’étape de la définition du sujet, où l’on prendra soin de découper le sujet et de trouver, au besoin, des synonymes pertinents ou des termes à rejeter. Enfin, on doit déterminer s’il est utile de limiter la recherche en fonction de critères géographiques, linguistiques ou chronologiques.

Tout chercheur expérimenté a intégré ces tâches au point d’en faire des automatismes. Mais leur effet sur la mise en oeuvre (choix de l’outil de recherche, formulation de la requête) et sur l’issue d’une recherche ne vont pas de soi pour un novice. La trousse se veut donc un outil dynamique et flexible, qui saura assister les utilisateurs dans chacun des choix qu’ils devront faire et, ainsi, les amener à mesurer l’importance d’une préparation adéquate.

La recherche
Selon le contexte et le besoin de recherche, le chercheur pourra déterminer d’abord à l’intérieur de quelle composante d’Internet il devra chercher (Web, forums de discussion, ftp, etc.) et quelle famille d’outils (répertoires, moteurs ou métamoteurs) sera la plus efficace pour repérer l’information qu’il recherche. Un tableau comparatif des caractéristiques des différents outils lui permettra de choisir l’outil de recherche qui lui permettra de formuler une requête la plus précise possible en fonction de son besoin de recherche.

Une fois l’outil choisi, le chercheur devra traduire son besoin en fonction de la syntaxe liée à cet outil : opérateurs booléens, opérateurs de proximité, recherche d'expression exacte, troncature et masques, restriction à une caractéristique, parenthèses… autant de codes qui permettent de traduire la requête en respectant le langage d'interrogation de l’outil sélectionné et en tirant un maximum de profit des fonctions de repérage automatisées. Pour faciliter l’apprentissage de ce langage plutôt obscur pour le non-initié, les auteurs de la trousse ont conçu des exercices pratiques qui amèneront l’étudiant à interroger des moteurs ou des répertoires, et à observer les résultats obtenus selon différentes formulations de la requête.

L’analyse
Bien souvent, les résultats obtenus à la suite d’une requête ne correspondent pas à ce qu’on espérait trouver : on n’obtient aucun résultat ou pas assez, ou encore, à l’inverse, trop de résultats ! Une brève analyse permet de réajuster son tir. Pour ce faire, les auteurs de la trousse proposent plusieurs pistes de solution selon le type de difficultés rencontrées.

Après avoir trouvé un certain nombre de sites pertinents, il faut ensuite juger de la valeur de l’information. N’importe qui peut déposer son livre dans l’étrange bibliothèque, ne l’oublions pas ! Quelques répertoires sont soumis à un certain contrôle de la valeur de l’information qui s’y trouve, mais la plupart des outils de recherche visent à recenser un maximum de sites, peu importe leur contenu. Au chercheur donc de procéder à sa propre évaluation critique, à l’aide d’une liste de critères fournis dans la trousse.

La diffusion
L’utilisation de l’information puisée dans Internet est soumise essentiellement aux mêmes règles que celles du secteur de l’édition : il faut citer ses sources et utiliser l’information dans le respect des droits d’auteur. Cependant, ces pratiques doivent être adaptées au contexte d’Internet.


Au moment de la rédaction de cet article, la réalisation technique de la Trousse de recherche d’information efficace dans Internet n’était pas achevée. Vous pourrez la consulter à partir du mois d’août prochain à l’adresse suivante :
http://ccfd.crosemont.qc.ca/cours/guides/default.htm


cdumont@ccfd.crosemont.qc.ca

Creative Commons License Cette création est mise à disposition sous un contrat Creative Commons. Dernières mises à jour : 10/04/2015