Yooda
Outils pour l’analyse et le suivi du référencement
Articles
Article Référencement : Etude sur la structure des pages d'accueil
Nous allons étudier les structures de 111000 pages
présentes dans les rubriques francophones de Dmoz. L'objectif
de cette étude est de déterminer la structure de ces
dernière afin d'en relever les faiblesses par rapport
aux problématiques de référencement et de visibilité.
Pour cette étude, nous avons effectué une analyse du
code html de 111 000 pages issues de l'annuaire Dmoz.
Cela nous à permis de détecter les pages avec un contenu
faible. C'est-Ã -dire moins de 20 groupes de 1,2 ou 3
mots clés dans les élément suivants : le texte, le titre,
les " alt image " et les " title " sur les liens et
les images. Nous avons détecté les pages pourvues de
frames ainsi que celles avec un " Meta refresh " vers
une autre page, (technique simple permettant une redirection
de la page).
|
Type de page d'accueil
|
Nombre
|
Pourcentage
|
|
| Frame |
18 421
|
16,49%
|
|
| Redirect "Meta refresh" |
4 816
|
4,31%
|
|
| Page avec contenu |
63 305
|
56,66%
|
|
| Page d'accueil avec un contenu faible. |
25 184
|
22,54%
|
|
|
Total
|
111 726
|
100,00%
|
|
Le tableau ci-dessus représente la répartition des sites
en fonction du type de page détecté.
I) Les pages avec des frames
Nous constatons que 16,49% des pages sont construites
avec des frames. Ce qui à l'heure d'aujourd'hui pose
toujours des problèmes d'indexation à certains
robots. Cependant une analyse plus précise de ces dernières
nous a permis de déterminer que la frame principale
renvoie sur un autre nom de domaine pour 15%
des pages construites suivant ce principe. Cette technique
peut donc permettre de n'avoir qu'un site à maintenir
en affichant dans une frame unique le second site. Elle
donne aussi la possibilité de " cacher " le site réel.
Il s'agit souvent d'un hébergement gratuit, d'une boutique
en ligne ou encore d'une affiliation.
II La balise Meta Refresh
Elle est utilisée dans 40% des cas pour rediriger
vers un site différent. Il s'agit d'un bon moyen
pour assurer une transition " en douceur " entre deux
sites. Le délai paramétrable avant le changement de
page permet de laisser un message, avant de rediriger
le visiteur, du style " Mon site a déménagé ! Mettez
à jour vos Favoris ".
Certains webmasters utilisent cette technique pour avoir
une page d'accueil optimisée pour les robots d'indexation
et une vraie page d'accueil pour les internautes. Attention
toutefois à l'utilisation de cette technique, ainsi
Google n'indexe que les pages ayant un refresh supérieur
à 0. Une durée de 2 secondes permettra ainsi une indexation
de la page.
III) Les pages avec contenu
Elles ne représente que ... 56,66% de notre étude.
Les sites avec frames ou refresh ne sont bien entendu
pas comptabilisés. Nous avons donc 22,5% de nos pages
avec un contenu de moins de 20 mots ou groupes de mots
pertinents (+ de 2 caractères et on élimine les " les,
mes, tes ").
A noter que les redirections javascripts ne sont pas
prises en compte dans cette étude. Elles sont toujours
aussi difficiles à détecter pour les robots d'indexation.
Celui que nous avons créé pour cette étude ne fait pas
exception à la règle, du moins pour le moment ;) .
RÉFÉRENCEMENT