Articles

Article Référencement : Etude sur la structure des pages d'accueil

Nous allons étudier les structures de 111000 pages présentes dans les rubriques francophones de Dmoz. L'objectif de cette étude est de déterminer la structure de ces dernière afin d'en relever les faiblesses par rapport aux problématiques de référencement et de visibilité.

Pour cette étude, nous avons effectué une analyse du code html de 111 000 pages issues de l'annuaire Dmoz. Cela nous à permis de détecter les pages avec un contenu faible. C'est-à-dire moins de 20 groupes de 1,2 ou 3 mots clés dans les élément suivants : le texte, le titre, les " alt image " et les " title " sur les liens et les images. Nous avons détecté les pages pourvues de frames ainsi que celles avec un " Meta refresh " vers une autre page, (technique simple permettant une redirection de la page).

Type de page d'accueil
Nombre
Pourcentage
Frame
18 421
16,49%
Redirect "Meta refresh"
4 816
4,31%
Page avec contenu
63 305
56,66%
Page d'accueil avec un contenu faible.
25 184
22,54%
Total
111 726
100,00%


Le tableau ci-dessus représente la répartition des sites en fonction du type de page détecté.

I) Les pages avec des frames

Nous constatons que 16,49% des pages sont construites avec des frames. Ce qui à l'heure d'aujourd'hui pose toujours des problèmes d'indexation à certains robots. Cependant une analyse plus précise de ces dernières nous a permis de déterminer que la frame principale renvoie sur un autre nom de domaine pour 15% des pages construites suivant ce principe. Cette technique peut donc permettre de n'avoir qu'un site à maintenir en affichant dans une frame unique le second site. Elle donne aussi la possibilité de " cacher " le site réel. Il s'agit souvent d'un hébergement gratuit, d'une boutique en ligne ou encore d'une affiliation.

II La balise Meta Refresh

Elle est utilisée dans 40% des cas pour rediriger vers un site différent. Il s'agit d'un bon moyen pour assurer une transition " en douceur " entre deux sites. Le délai paramétrable avant le changement de page permet de laisser un message, avant de rediriger le visiteur, du style " Mon site a déménagé ! Mettez à jour vos Favoris ".

Certains webmasters utilisent cette technique pour avoir une page d'accueil optimisée pour les robots d'indexation et une vraie page d'accueil pour les internautes. Attention toutefois à l'utilisation de cette technique, ainsi Google n'indexe que les pages ayant un refresh supérieur à 0. Une durée de 2 secondes permettra ainsi une indexation de la page.

III) Les pages avec contenu

Elles ne représente que ... 56,66% de notre étude. Les sites avec frames ou refresh ne sont bien entendu pas comptabilisés. Nous avons donc 22,5% de nos pages avec un contenu de moins de 20 mots ou groupes de mots pertinents (+ de 2 caractères et on élimine les " les, mes, tes ").

A noter que les redirections javascripts ne sont pas prises en compte dans cette étude. Elles sont toujours aussi difficiles à détecter pour les robots d'indexation. Celui que nous avons créé pour cette étude ne fait pas exception à la règle, du moins pour le moment ;) .


Les marques, logos et noms des outils de recherche cités sur ce site sont la propriété exclusive de leurs propriétaires respectifs. All logos and trademarks in this website are property of their respective owner.
YOODA est un service de la société ALDEIS - ©2007 all rights reserved Mais aussi: