Pages d'erreurs et règles d'un site
Cette page présente la manière et l'intérêt de personnaliser les pages d'erreurs d'un site ainsi que les différents fichiers permettant de définir les règles à apporter à votre site notamment par rapport aux moteurs de recherches internet.
Pages d'erreurs personnalisées
Si vous n'activez pas les pages d'erreurs personnalisées alors vos visiteurs rencontrant un problème ne verront qu'une page blanche affichée par votre serveur web, ne contenant juste qu'un texte court avec le nom de l'erreur, généralement en anglais. En pareil cas de figure, vos visiteurs pourront alors penser à tort que votre site ne fonctionne plus ou n'existe plus.
Afin d'éviter cela, TOWeb vous permet de gérer toutes les erreurs HTTP par un simple clic de manière à afficher non seulement vos éventuels messages personnalisés selon les erreurs, mais surtout en générant automatiquement une page web complète de votre site Web incluant le thème, le pied de page et le menu de votre site (comme tous les autres pages) afin que vos visiteurs peuvent aller directement à une autre page de votre site lorsqu'ils rencontrent une erreur.
Nous vous recommandons donc d'activer toutes les erreurs HTTP afin qu'elles puissent être gérées automatiquement au niveau de votre site Web. Les erreurs les plus fréquemment observées sont les erreurs 500 et 404. Voici quelques conseils et informations complémentaires relatives à ces 2 erreurs :
Erreur HTTP 404
La plupart des internautes sont tenus de reconnaître celle-ci. Une erreur 404 se produit lorsque vous essayez d'accéder à une ressource (généralement une page web) qui n'existe pas ou plus sur un serveur Web. Les raisons pouvant produire ce type de problème peuvent être par exemple un lien brisé, une URL mal orthographié ou une page Web que vous avez déplacée, renommée ou supprimée sur votre site web.
Erreur HTTP 500
Ce message d'erreur assez général apparaît quand un serveur Web rencontre une erreur de fonctionnement interne. Par exemple, le serveur Web peut être surchargé ou doit être redémarré parce qu'il est incapable de gérer certaines demandes Web correctement. Selon les statistiques de recherche de Google, ce problème est rencontré deux fois plus fréquemment que celui de l'erreur 404.
Il est à noter que les messages d'erreurs HTTP sont rapportés à vos visiteurs par votre serveur Web, mais qu'une personne ayant par exemple une ligne internet coupée ou défaillante ne pouvant pas du tout accéder à votre site, alors cette personne ne verra pas vos pages d'erreur personnalisées mais un message d'erreur de "time out" affiché au bout d'un certain temps par son navigateur pour signaler que la connexion ne peut être effectuée.
Fichier .htaccess
Un fichier .htaccess est un fichier de configuration qui sera utilisé par votre serveur pour configurer par exemple des droits d'accès, des redirections d'URL ou des associations d'extension de nom de fichier à un type MIME.
La création du contenu d'un fichier .htaccess nécessite donc des connaissances en administration de serveur web et la plus grande prudence est de mise si vous en créez un car un erreur dans son contenu peut entraîner des dysfonctionnements au niveau du comportement/affichage de votre site voir même le plantage de votre serveur web. Si vous aviez auparavant l'habitude de gérer le fichier .htaccess de votre site par vous-même en dehors de TOWeb (par exemple avec une ancienne version de TOWeb ou avec une autre solution que TOWeb) alors nous vous conseillons de l'importer dans votre site TOWeb (soit en ajoutant le votre, soit en le recréant avec ensuite des copier/coller de son contenu).
Enfin sachez que le contenu d'un fichier .htaccess peut dépendre du type de serveur que vous utilisez ainsi que d'éventuelles contraintes ou limitations de la part de votre hébergeur. Nous vous invitons donc à contacter votre hébergeur pour plus d'informations à ce niveau si jamais vous avez des règles ou besoins spécifiques à effectuer au niveau de votre serveur web.
Note: une fichier .htaccess peut également être utilisé pour gérer des messages d'erreurs personnalisés mais cela est inutile si vous activez les pages d'erreurs personnalisées dans TOWeb.
Fichier robots.txt
Un fichier “robots.txt” indique aux moteurs de recherche s’ils peuvent accéder ou non à certaines parties de votre site. Ce fichier est par défaut automatiquement créé et remis à jour par TOWeb dans le répertoire racine de votre site. Nous vous conseillons d'activer l'option "Ajouter automatiquement les pages non publiques et les scripts de votre site" de manière à ce que TOWeb puisse remettre à jour ce fichier de manière automatique à chaque publication de votre site en fonction de son contenu et des fonctionnalités de TOWeb que vous avez utilisées sur votre site.
Vous n'avez donc normalement rien à faire de plus à ce niveau sauf si vous avez des besoins spécifiques comme par exemple si vous publier des sous-sites ou possédez des sous-répertoires de votre site qui ne sont pas gérés par TOWeb. Auquel cas, si vous estimez que vos répertoires (ou fichiers) ne doivent pas figurer parmi les résultats de recherche possible de moteurs de recherche internet alors vous pourrez empêcher l’exploration de ces répertoires et de leur contenu ajoutant votre propre fichier robots.txt.
Il est à noter que si vous utilisez l'option "Ajouter automatiquement les pages non publiques et les scripts de votre site" alors TOWeb utilisera le contenu de votre fichier robots.txt mais lui ajoutera aussi, en plus, toutes les exclusions des fichiers nécessaires au bon fonctionnement de votre site (mais inutiles pour les moteur de recherche).
En cas de besoin, vous trouverez également sur le site des Outils Google pour les webmasters un générateur de fichier robots.txt facile à utiliser. Enfin si votre site utilise des sous-domaines et que vous souhaitez empêcher l’exploration de certaines pages d’un sous-domaine précis, alors vous devrez utiliser un fichier robots.txt distinct pour chaque sous-domaine concerné. Pour plus d’informations sur les fichiers robots.txt, nous vous conseillons également de consulter le guide du centre d’aide de Google pour les webmasters relatif à l’utilisation de fichiers robots.txt.