L'indexation d'un site Internet » Gazelle du Web 

Menu

Référencement : Optimiser l’indexation de son site Web

11 janvier 2012 par Davy
optimisation

optimisation

Il y a quelques semaines, nous avions vu quelques conseils rédactionnels pour améliorer le référencement de son site Internet. Optimiser des contenus c’est bien, mais il faut aussi que la technique suive. Je vous propose une petite série d’articles pour compléter cette boulimie d’optimisation, mais cette fois sous un angle un peu plus technique, à destination des professionnels du Web ou des utilisateurs avertis. Les recommandations qui vont suivre, peuvent paraître triviales  pour un professionnel du Web, cependant je reste surpris de voir le très faible nombre de sites qui les suivent… L’important est donc moins de connaitre ces règles que d’avoir l’organisation de qualité qui permet de les mettre en application sur chaque projet.

Cette semaine nous allons parler d’« indexation ».

Qu’entend-t-on par indexation d’un site Web ?

Pour extraire les contenus des sites Internet, les moteurs de recherche utilisent des robots d’indexation (ou « web crawler » ou « bot »). Ces robots d’indexation visitent en permanence les sites Internet en passant de page en page pour récupérer les contenus. C’est l’analyse de ces contenus qui permet ensuite au moteur de recherche de proposer des résultats pertinents en fonction des recherches des internautes. Vous l’aurez compris, l’indexation est une étape fondamentale dans le référencement d’un site. Un site de qualité et optimisé permettra à Google (et aux autres) de facilement récupérer l’ensemble de ses contenus.

 

Liens internes : menu, fil d’Ariane et plan de site

Pour indexer l’intégralité des contenus d’un site Web, les moteurs de recherche doivent parcourir chaque page d’un site. Pour récupérer la liste des pages qui constituent un site, les moteurs de recherche parcourent le contenu d’une page à la recherche de liens vers d’autres pages en vue de les explorer à leur tour. Pour faciliter le travail des robots d’indexation, il faut s’assurer que chaque page d’un site est accessible par un lien hypertexte explicite.  Le menu d’un site et le fil d’Ariane sont des éléments stratégiques qui permettent à l’internaute et à Google de naviguer de page en page. A ce titre, nous les conseillons sur l’ensemble des pages de votre site.

La présence d’une page « plan de site » qui liste l’ensemble des pages d’un site Web de manière ordonnée sera un excellent moyen pour permettre à Google de répertorier l’ensemble des pages d’un site Web.

 

Limitation des moteurs d’indexation : Flash / AJAX et formulaire

Bien que beaucoup de progrès aient été accomplis par les moteurs de recherche pour rendre leurs robots d’indexation de plus en plus intelligents, ceux-ci présentent plusieurs limites. Ainsi les contenus (et donc les liens) qui se trouvent encapsulés dans du « Flash », dans une image, ou qui sont générés dynamiquement via un javascript  seront difficilement vus par les moteurs d’indexation. Attention également aux pages qui ne seraient accessibles qu’à partir d’un formulaire (liste de sélection, moteur de recherche, etc.) comme par exemple un annuaire dont les fiches ne seraient accessibles que par un champ de recherche.

Fichier sitemap.xml

Proposé initialement par Google, et adopté par la plupart des autres moteurs de recherche, le protocole Sitemap permet de faciliter le travail des robots d’indexation en mettant à leur disposition un fichier (voir un exemple de fichier sitemap.xml) qui liste l’ensemble des pages d’un site Web en précisant celles qui ont été modifiées.

Conclusion

Si l’indexation d’un site web est le point de départ d’un bon référencement, il n’est pas la garantie d’un bon positionnement. Nous verrons ensemble dans de futurs articles comment optimiser le positionnement de votre site Web.


1 commentaire »

  1. Une infographie proposant une checkliste pour le référencement SEO : http://pinterest.com/pin/127860076890899071/

    Comment par La Gazelle du Web — 19 mars 2012 @ 16 h 07 min

Laissez un commentaire