L’optimisation technique pour le référencement
Résumé
Le référencement d’un site nécessite de faciliter son exploration par les robots des moteurs de recherche. Son architecture doit être la plus simple ; son code doit respecter les standards, ne pas comporter d’erreurs et être moderne ; sa performance doit rendre le chargement de ses pages le plus rapide.
Revue en détails des points cruciaux du SEO.
Philippe Le Mesle
Lien permanent de l'article
Tags : optimisations ~ référencement ~ SEO
Commentaires (12)
L’optimisation technique d’un site consiste à simplifier son exploration par les robots des moteurs en manipulant 4 leviers : son architecture, son code, la structure de ses pages et sa performance en terme de rapidité d’affichage.
L’architecture du site
Le référencement d’un site se pense avant d’écrire la toute première ligne de code. Il n’y a nullement besoin d’un ordinateur : des feuilles de papier suffisent. Des feuilles sur lesquelles le concepteur va construire une architecture simple et ordonnée. Elle va servir à organiser le contenu d’une manière logique, en se mettant à la place de l’internaute : créer différents niveaux de pages, catégoriser le contenu dans des rubriques et concevoir la navigation entres les pages de telle manière qu’elle soit la plus simple et la plus fluide possible. Cet architecte doit penser avant tout aux futurs visiteurs qui devront accéder aux différentes parties du site sans avoir trop de liens à cliquer, mais, aussi, aux robots des moteurs de recherche qui doivent crawler les différentes pages depuis ces liens qu’ils vont trouver.
Le code
HTML est le langage utilisé pour construire les pages Web. Les fichiers qui les accompagnent pour leurs design sont des feuilles de styles appelées CSS. Il est essentiel pour ces documents d’avoir un code de qualité et il est préférable que ce code utilise la dernière génération du langage, tout du moins pour HTML. Pourquoi ?
Pour 2 raisons :
- avoir un code exempt d’erreurs et donc conforme aux recommandations du W3C permet, en principe (on peut toutefois conserver un code invalide, mais, pour des raisons particulières), d’être assuré qu’il sera bien interprété par les navigateurs. Si le code est mal formé, les risques d’erreurs d’affichage dans les différents browsers ainsi que dans leurs différentes versions, seront nombreux. En outre, un code mal formé, demandera plus de calcul et ralentira, par conséquent, l’affichage de la page. Les robots des moteurs de recherche étant des navigateurs aussi, il est donc capital pour le référencement que ce code soit le plus soigné possible.
- la dernière génération d’HTML, c’est HTML51.1Pour aller plus loin sur HTML5 : HTML5 expliqué & Pourquoi choisir HTML5 ?
HTML5 sera le langage des pages Web dominant dans les années à venir. Outre, l’économie de scripts qui alourdissent le traitement des pages, HTML5 améliore l’analyse de celles-ci par les robots des moteurs de recherche. A contrario de son prédécesseur, son balisage étant sémantique22Cela signifie que les balises utilisées sont porteuses de sens., ils peuvent traiter chacune des sections de la page comme des entités et accorder une valeur plus importante au contenu principal.
La structure des pages
Quand les robots des moteurs de recherche parcourent votre site, ils ne le voient pas comme ses visiteurs. Les feuilles de styles servant à la mise en page n’étant pas lues, ils ne distinguent que le texte. C’est ce contenu textuel qu’il faut mettre en avant afin qu’il soit bien référencé. Une structure de page optimisée doit permettre aux robots de distinguer aisément le contenu principal des autres blocs divisant la page.
Si les balises sémantiques sont utilisées il faut que ce soit en conformité avec le rôle qui leur a été défini par la norme HTML5. Le contenu des sections divisant la page doit être cohérent avec leurs fonctions. Il faut donc les employer pour aider les moteurs de recherche à les traiter comme des entrées distinctes et à mieux appréhender le contenu principal.
Une page Web est organisée en blocs. Ses différents blocs (ou sections) se placent visuellement dans la page par la feuille de styles qui appliquent le design (propriétés de couleurs, de tailles, de positions etc.). L’organisation fréquente d’une page comprend ces éléments :
- une barre de titre
- un menu
- un contenu
- une, ou plusieurs colonnes (ou sidebar)
- un pied de page
En HTML5, ces différents blocs sont définis par autant de balises différentes33Pour simplifier, car HTML5 permet à chaque bloc (à l’exception de <nav>) de disposer de sa propre structure. :
- <header> pour la barre de titre
- <nav> pour le menu
- <article> pour le contenu principal
- <aside> pour la colonne
- <footer> pour le pied de page
Le balisage sémantique d’HTML5 définissant le rôle de chaque élément de la page, les algorithmes des moteurs de recherche accordent à certains d’entre eux un poids différent avec une valeur supérieure au contenu principal. C’est, bien sûr, celui que voulez voir figurer dans les SERP44C’est par cet acronyme, « SERP », que les référenceurs désignent les résultats des requêtes des internautes dans les moteurs de recherche..
La vitesse
La rapidité d’affichage d’une page Web est un facteur déterminant de la satisfaction de l’usager d’un site. Certes, les performances des connexions et du matériel se sont considérablement accrues, mais les pages Web se sont enrichies de graphismes plus élaborés, de photos plus lourdes, de composants audio et vidéo, de fonctionnalités avancées pour l’interactivité...
Et si le poids des pages est beaucoup plus important que par le passé, ce n’est pas tant la masse des informations que contient une page Web qui peut freiner son affichage, mais la façon dont celles-ci vont être servies depuis le serveur vers le navigateur.
Comment s’affiche une page Web ?
Pour qu’une page provenant d’un serveur Web s’affiche dans votre navigateur il faut qu’un certain nombre de tâches55Il s’agit du code HTML, des feuilles de styles (CSS), de scripts, ainsi que des contenus multimédia ... s’éxécutent. Du côté serveur bien sûr mais, aussi, du côté de votre navigateur. La performance du site dépend donc de sa construction. Si elle vise la satisfaction de l’internaute, la vitesse d’affichage des pages influe le référencement de celles-ci par les moteurs de recherche66Il s’agit d’une moyenne calculée sur l’ensemble des pages du site.
Voir le tableau ci-après..
Google estime en effet la frontière entre les sites lents et les sites rapides à 1.5 seconde77Mais pas seulement. Découvrez d’autres raisons de disposer d’un site Web rapide.. Au-dessous de ce seuil Google considère que le site est plus rapide que 90% des sites qu’il a indexé. Si les sites lents ne souffrent pas de pénalités, les plus rapides sont dorénavant favorisés, le moteur de recherche prenant en compte dans son algorithme ce critère pour le positionnement des pages du site.
Conclusion
Pour le référencement naturel de votre site ses pages doivent être bien construites pour être plus performantes et être ainsi privilégiées par Google ainsi que d’autres moteurs. Ces moteurs qui pour circuler ont besoin d’essence : le contenu. C’est l’objet du deuxième volet de cette suite d’articles :
La rédaction et l’organisation du contenu pour le référencement.

Commentaires :
Mathieu
#1 ~Très bon article.
J'ai une petite question : Google privilège t-il les sites en HTML 5 ?
Philippe Le Mesle @ Normandie-Web
#2 ~À ma connaissance, non. Ce n’est pas parce qu’un site est codé dans un langage particulier que Google va mieux le positionner. Par contre si les balises d’HTML5 sont bien utilisées le robot comprendra mieux la géographie de la page. C’est l’un des avantages d’HTML5.
Aurélien Delefosse
#3 ~Très bon article, on devrait le faire suivre à pas mal de monde.
Je mettrais tout de même un bémol sur la compatibilité aux normes W3C, qui est je l'accorde un plus, mais loin d'être une obligation. Disons que l'on doit tendre vers...
Maxime de l'agence Wype
#4 ~D'accord avec Aurélien, la validité W3C doit être un objectif plus pour s'éviter des problèmes d'affichage ou de compatibilité. Mais Google peut crawler même sans un code valide, il promeut même des fois des codes invalides (ou plutôt pas encore valide), notamment avec des micro-formats.
Sylvain @ DiffuzNews
#5 ~C'est un bon résumé des conditions d'ordre structurelles qu'il faut respecter pour optimiser un site.
Un site rapide permet aussi à Google d'économiser des ressources serveur. De fait, je pense que la rapidité d'un site deviendra de plus en plus importante dans le référencement puisque ce facteur agit finalement directement sur les bénéfices de Google.
Je pense qu'il ne faut pas non plus oublier, dans contenu de bien travailler ses ancres internes. Elles aident les moteurs bien analyser les contenus liés.
Philippe
#6 ~Merci pour vos commentaires.
@ vous 3, ce n’est pas un article très technique comme vous aurez pu le noter. Il est plus destiné à mes (futurs) clients en référencement naturel qu’à des spécialistes du SEO tels que vous.
@ Maxime,
Très souvent les extraits de code que donne Google pour ces exemples (sur Google France) sont truffés d’erreurs.
francois @ Photos de concert
#7 ~Joli blog que je découvre grâce à cet article et que je place dans mes RSS!
Concernant la structuration du html5 avec notamment la balise et google qui prendrai moins en compte les liens contenu dans les sidebar que ceux issus du contenu, est-ce un choix judicieux de la déclarer ?
Philippe
#8 ~françois, il ne faut pas mettre les crochets...
De quelle balise parles-tu ?
francois @ Photos de concert
#9 ~Au temps pour moi pour les crochets, je voulais dire "...notamment la balise aside...".
En gros déclarer ouvertement des liens en sidebar plutôt que dans le contenu ;)
PS : depuis mon précèdent post, j'ai lu qu'utiliser aside pour déclarer une sidebar serait faux. Je n'ai cependant pas trouver une réponse claire et argumentée dans la manière de déclarer la sidebar en html5.
Philippe
#10 ~Ah !
Je vois...
À l’origine aside ne devait être utilisé que pour du contenu en relation directe avec le sujet de la page (celui de la balise article par exemple)...
puis ça a changé, sans que ce soir vraiment clair.
Les exégètes d’html5 (voir HTML5 Doctor sur la balise Aside) s’y perdent encore...
Tant que son statut n’est pas clairement défini, autant passer par la balise section qui peut recevoir sa propre hiérarchie de titres (H1,H2 etc.) Pour le contenu en rapport à l’article (les notes) c’est la balise mark que j’emploie...
Denis
#11 ~Article très très intéressant et dans un blog au design original et sympa. j'aime beaucoup.
Antoine@I'm With You
#12 ~Personnellement je commence à faire passer tous mes sites sur des frameworks HTML5 et j'en
suis TRES satisfait ! C'est beau, simple, rapide, facile à utiliser. Bref, vive le HTML 5 !