Google, Bing, Yahoo… Comment fonctionne un moteur de recherche ?

Le fonctionnement d’un moteur de recherche… et oui, c’est important pour un référenceur !

Ola l’ami. Si tu es arrivée jusqu’ici, c’est que tu t’es mis au SEO et que tu travailles en ce moment le référencement de ton site web… non ?

Sinon, soyons honnête, qu’est-ce que tu en aurais à fiche de savoir comment fonctionne Google ou Bing ?

Bon, il se peut que tu sois curieux, mais généralement, quand on s’intéresse à ce qui se passe sous la capot d’un moteur de recherche, c’est qu’on a un intérêt dans l’affaire.

Que ce soit le cas ou pas, voici quelques informations qui te seront utiles.

Attention : cet article n’a pas vocation à être technique, n’est-ce-pas ! D’autres font ça mieux que nous. L’ambition, ici, est juste de te donner une idée générale du fonctionnement d’un moteur de recherche, qui facilitera ensuite ton travail de référencement.

 

Ces crawlers qui filent partout sur le web

Tout commence avec les crawlers. Chaque moteur de recherche a les siens :

  • pour Google, le Googlebot ;
  • pour Bing, le Bingbot ;
  • pour Yahoo… le Slurp (on vous a bien eu, hein ?)

 

Etc, etc… encore une fois, chaque moteur dispose de ses propres crawlers. Ils lui servent à explorer le web.

Eh oui, ça n’est pas plus compliqué que ça. Ces petits scripts se baladent d’un site à un autre en suivant les backlinks.

Sachez qu’il existe plusieurs types de crawlers, en particulier chez Google : les spécialistes du web “desktop”, les spécialistes des images, les spécialistes du mobile…


Mais
in fine, leur rôle est le même : explorer un maximum de pages.


Et attention, pas de droit du travail chez les crawlers, ni de grève, ni quoi que ce soit du genre : ceux de Google, par exemple, se baladent chaque jour sur
plusieurs milliards de page.

Ceci dit, la besogne n’est pas très compliqué, comme le rappelle Olivier Andrieu (Site Abondance) : un crawler doit uniquement suivre des liens et envoyer au moteur le contenu HTML des pages qu’il découvre.

 

L’indexation et le “stock” des données dans les datas centers

Le moteur de recherche  stocke ensuite tous les contenus découverts par ses robots dans un data center (un truc immense blindé de disques durs).

Ca s’appelle l’indexation, ça signifie que votre page est désormais connue du moteur. Et donc qu’il est en capacité de le proposer à des internautes.

Concrètement, et en simplifiant, cela se passe chaque fois que l’un d’entre fait une requête dont les mots se trouvent quelque part dans une de vos pages.

Un exemple ? Votre site parle de recettes de tomates farcies. Si un internaute tape “recette tomates farcies” dans la barre de recherche de Google – et que Google a indexé votre site – alors vos pages seront proposées à l’internaute en question.

En première ou en 1456ème position ? C’est une autre histoire et c’est justement pour vous rapprocher du saint graal de la première page des résultats que vous allez faire du référencement.

 

Notez au passage qu’un moteur “n’attend” pas que l’internaute finisse de taper sa requête pour lui proposer des résultats.

Il affiche aussitôt des suggestions, basées sur des requêtes populaires. Faites un essai avec le nom d’un politicien ou d’un sportif connu, vous allez voir..

 

“Pourquoi est-ce important pour moi ?” demanderas-tu.

 

“Ah mais relis donc les lignes précédentes !” répondrons-nous. TOUT commence avec l’indexation !

Si Google ou Bing ne connaissent pas ton site, comment veux-tu qu’ils le proposent aux internautes ? Cela signifie déjà plusieurs choses :

  • Si d’autres sites font des liens vers le tien, c’est positif : cela signifie que les robots des moteurs ont davantage de chances de le trouver (même s’il est possible de faire autrement pour qu’ils passent, bien entendu). 
  • Ton site doit être configuré correctement. Par exemple, si tes pages sont en “NO INDEX”, cela signifie… bah que tu refuses l’indexation et donc que tes pages ne seront pas proposées aux internautes.Il y a parfois de bonnes raisons de le faire, mais si ton objectif est le référencement, clairement, il faut que les pages soient accessibles (en tous cas celles que tu souhaites positionner sur Google.

    Pas sûr que ce soit le cas de la page Mentions légales qui, elle, peut rester désindexée).

 

Autre chose jeune Padawan : si tu fais des modifications sur une page, il faudra attendre que le crawler passe de nouveau pour que le moteur les prenne en considération et fasse évoluer, éventuellement, sa position dans les résultats de recherche.

Donc… un peu de patience !

Cette leçon étant terminée, plus rien nous ne t’enseignerons aujourd’hui. Vide ton esprit de ses questions, et que la force du référencement soit avec toi pour la suite de ta lecture.

Ajouter votre grain de sel ?

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.