Les stratégies de recherche et la problématique du référencement

Ecrit le 7 mai 2000 en partant d'un article d'une étude sur la politique des moteurs de recherche [Introna] et pour honorer la demande des différents moteurs de recherche ou sites de référencement, qui m'ont effectivement aidé, de placer leurs bannières quelque part dans mes pages sans alourdir les pages importantes.

Les deux fondements de l'Internet sont la disponibilité et l'accessibilité de l'information.
Les moteurs de recherche ne peuvent déjà plus indexer les milliards de pages WEB existantes ; d'après des études récentes [Lawrence], les meilleurs moteurs de recherche actuels indexent 16% du WEB et le total combiné de tous les moteurs de recherche ne couvre que 42% du WEB mondial.

Le lecteur de pages Web cherche principalement les informations suivantes :

Les actualités sont des informations souvent temporaires qui répondent à la question : que se passe-t-il aujourd'hui dans le monde ?
Les contenus encyclopédiques sont des informations pérennes que l'on ne peut pas stocker en permanence chez soi  ou à son lieu de travail ; c'est la réponse à la question : que sait-on précisément sur le sujet qui m'intéresse ?
La recherche d'interlocuteurs est un besoin fondamental qui détermine les activités sociales et répond à la question : qui sait quoi, ou, qui fait quoi ?

Le créateur de page Web, en dehors du choix des thèmes qu'il veut présenter, doit effectivement se poser les trois questions qui répondent aux attentes du lecteur :

Dans ces jeux de questions-réponses les moteurs de recherche mettent en oeuvre différentes stratégies d'indexation, de recherche de liens (crawling) et de classement (ranking) des réponses correspondant à chaque requête.
Le but d'un créateur de page Web consciencieux est, évidemment, d'abord d'être indexé dans le plus grand nombre possible de moteurs de recherche, ensuite, de figurer parmi les dix premières réponses pour les requêtes qui relèvent des thèmes qu'il traite.

Les moteurs de recherche ont besoin principalement de 4 méta-informations :

Le plus souvent, seuls le titre et le résumé des contenus sont présentés aux lecteurs, il est donc indispensable de prendre soin des titres et des résumés.
Par exemple, pour cette page ces informations, cachées dans le code source HTML, sont :
   <meta name="Author" content="Aimé Vareille">
   <meta name="Description" content="Considérations sur l'usage des moteurs de recherche et les problèmes de référencement.
le 7 mai 2000">
   <meta name="Keywords" content="recherche,referencement,accessibilite,visibilite,web,accessibility,visibility,search engine">
   <title>Recherche et R&eacute;f&eacute;rencement</title>

Une fois prêtes, les pages Web peuvent être déclarées manuellement auprès de ses moteurs de recherche préférés ; en fait, il existe plusieurs stratégies pour rendre visibles ses oeuvres :

De la même façon pour rechercher des pages : Actuellement les moteurs de recherche que j'utilise le plus souvent sont : Pour indexer rapidement son site dans des moteurs de recherche, le plus commode est de passer par un site de référencement automatique, il en existe beaucoup ; j'ai utilisé avec bonheur http://www.referencement-fr.com/qui donne d'excellents conseils sur la qualité du code HTML facilitant l'indexation ; j'ai été sollicité par http://www.acsis33.com/referencement/ qui propose un sondage à ses clients potentiels avec beaucoup de bonnes questions.
Le référencement prend au moins quinze jours, c'est le temps de rafraîchissement et mise à jour des données dans les moteurs de recherche, pour aller plus vite il faut s'inscrire dans les annuaires de pages personnelles, sur http://www.voila.fr/ la page personnelle est visible dans l'heure, sur http://www.yahoo.fr/, je n'ai reçu confirmation qu'au bout d'une semaine.

Il faut savoir que la publication de pages Web est considérée en France comme un acte légal qui engage sa responsabilité ; les fournisseurs d'accès et les moteurs de recherche restent très discrets sur les obligations légales qui accompagnent cet effort de création pour éviter de décourager les clients et d'entraver davantage la francophonie déjà en retard par rapport aux productions anglo-saxonnes :

Pour répondre aux questions "qui sait quoi ?" ou "qui fait quoi ?" il y a aussi les sites associatifs ou corporatifs. Ainsi, pour les matières universitaires il existe en France le site http://www.nexen.net/these_tipe/ et en Allemagne le site http://www.wer-weiss-was.de/ où vous pouvez référencer vos pages et vous déclarer expert dans la minute.

Les Universités se sont évidemment penchées sur le problème des méthodologies de recherche. L'académie de Grenoble pointe par exemple sur les travaux menés au Canada résumés en un Guide d'Initiation à la Recherche sur Internet qui est complété par GIRI 2 (Guide des Indispensables de la Recherche dans Internet) :  http://www.ac-grenoble.fr/giri/index.htm , http://www.ac-grenoble.fr/giri/giri2/index.html.

Pour conclure cette page, reprenons certains thèmes développés par Lucas Introna et Helen Nissenbaum [Introna] :


[Introna]  Lucas Introna, Helen Nissenbaum, "Defining the Web : The politics of Search Engines", Computer, vol. 33, n° 1, pp. 54-62, (http://www.computer.org/) January 2000.
[Lawrence] S. Lawrence, C. L. Giles, "Accessibility of Information on the Web", Nature, n° 400, 1999, pp. 107-109.


[logo] options

Rechercher dans le site perso.wanadoo.fr/aime.vareille
mot(s) clé(s) :
domaine :

N'hésitez pas à m'écrire sur ce sujet : aime.vareille@wanadoo.fr