HTTP 404

« 404 Introuvable » redirige ici. Pour l’épisode télévisé, voir 404 Introuvable (Mr. Robot).

Le message d’erreur HTTP 404, 404 Introuvable, 404, 404, Page Introuvable, Fichier Introuvable ou Message d’erreur Serveur Introuvable est un code de réponse standard du Protocole de Transfert Hypertexte (HTTP), dans les communications de réseau informatique, pour indiquer que le navigateur était capable de communiquer avec un serveur donné, mais que le serveur n’a pas pu trouver ce qui était demandé. L’erreur peut également être utilisée lorsqu’un serveur ne souhaite pas divulguer s’il possède les informations demandées.

Le serveur d’hébergement du site Web génère généralement une page Web « 404 Introuvable » lorsqu’un utilisateur tente de suivre un lien brisé ou mort; par conséquent, l’erreur 404 est l’une des erreurs les plus reconnaissables rencontrées sur le World Wide Web.

Vue d’ensemble

Lors d’une communication via HTTP, un serveur doit répondre à une demande, telle qu’une demande de navigateur Web pour une page Web, avec un code de réponse numérique et un message facultatif, obligatoire ou refusé (en fonction du code d’état). Dans le code 404, le premier chiffre indique une erreur client, telle qu’une URL (Uniform Resource Locator) mal typée. Les deux chiffres suivants indiquent l’erreur spécifique rencontrée. L’utilisation de codes à trois chiffres par HTTP est similaire à l’utilisation de tels codes dans des protocoles antérieurs tels que FTP et NNTP. Au niveau HTTP, un code de réponse 404 est suivi d’une « phrase de raison » lisible par l’homme. La spécification HTTP suggère l’expression « Introuvable » et de nombreux serveurs Web émettent par défaut une page HTML qui inclut à la fois le code 404 et l’expression « Introuvable ».

Une erreur 404 est souvent renvoyée lorsque des pages ont été déplacées ou supprimées. Dans le premier cas, il est préférable d’utiliser le mappage d’URL ou la redirection d’URL en renvoyant une réponse 301 Déplacée de manière permanente, qui peut être configurée dans la plupart des fichiers de configuration du serveur, ou par réécriture d’URL; dans le second cas, un 410 Gone doit être renvoyé. Parce que ces deux options nécessitent une configuration de serveur spéciale, la plupart des sites Web ne les utilisent pas.Les erreurs

404 ne doivent pas être confondues avec les erreurs DNS, qui apparaissent lorsque l’URL donnée fait référence à un nom de serveur qui n’existe pas. Une erreur 404 indique que le serveur lui-même a été trouvé, mais que le serveur n’a pas pu récupérer la page demandée.

Erreurs Soft 404

Certains sites Web signalent une erreur « introuvable » en renvoyant une page Web standard avec un code de réponse « 200 OK », signalant faussement que la page s’est chargée correctement ; c’est ce qu’on appelle un soft 404. Le terme « soft 404 » a été introduit en 2004 par Ziv Bar-Yossef et al.

Les 404 souples sont problématiques pour les méthodes automatisées de détection de la rupture d’un lien. Certains moteurs de recherche, comme Yahoo et Google, utilisent des processus automatisés pour détecter les soft 404. Les soft 404 peuvent se produire à la suite d’erreurs de configuration lors de l’utilisation de certains logiciels de serveur HTTP, par exemple avec le logiciel Apache, lorsqu’un document d’erreur 404 (spécifié dans a.fichier htaccess) est spécifié comme un chemin absolu (par exemple http://example.com/error.html) plutôt qu’un chemin relatif (/error.HTML). Cela peut également être fait exprès pour forcer certains navigateurs (comme Internet Explorer) à afficher un message d’erreur 404 personnalisé plutôt que de remplacer ce qui est servi par un message d’erreur « convivial » spécifique au navigateur (dans Internet Explorer, ce comportement est déclenché lorsqu’un 404 est servi et que le code HTML reçu est plus court qu’une certaine longueur, et peut être désactivé manuellement par l’utilisateur).

Il existe également des erreurs « soft 3XX » où le contenu est renvoyé avec un statut 200 mais provient d’une page redirigée, par exemple lorsque les pages manquantes sont redirigées vers la racine du domaine / page d’accueil.

Serveurs proxy

Certains serveurs proxy génèrent une erreur 404 alors qu’un code d’erreur de 500 plages serait plus correct. Si le serveur proxy ne peut pas satisfaire une demande de page en raison d’un problème avec l’hôte distant (comme des échecs de résolution de nom d’hôte ou des connexions TCP refusées), cela doit être décrit comme une erreur de serveur interne 5xx, mais peut fournir un 404 à la place. Cela peut confondre les programmes qui attendent et agissent sur des réponses spécifiques, car ils ne peuvent plus facilement faire la distinction entre un serveur Web absent et une page Web manquante sur un serveur Web présent.

404 intentionnels

En juillet 2004, le fournisseur de télécommunications britannique BT Group a déployé le système de blocage de contenu Cleanfeed, qui renvoie une erreur 404 à toute demande de contenu identifiée comme potentiellement illégale par l’Internet Watch Foundation. D’autres FAI renvoient une erreur HTTP 403  » interdite  » dans les mêmes circonstances. La pratique consistant à utiliser de fausses erreurs 404 comme moyen de dissimuler la censure a également été signalée en Thaïlande et en Tunisie. En Tunisie, où la censure était sévère avant la révolution de 2011, les gens ont pris conscience de la nature des fausses erreurs 404 et ont créé un personnage imaginaire nommé « Ammar 404 » qui représente « le censeur invisible ».

Codes d’erreur de sous-état Microsoft Internet Server 404

Le logiciel de serveur Web développé par Microsoft, Internet Information Services (IIS) de Microsoft, renvoie un ensemble de codes de sous-état avec ses 404 réponses. Les codes de sous-état prennent la forme de nombres décimaux annexés au code d’état 404. Les codes de sous-état ne sont pas officiellement reconnus par l’IANA et ne sont pas renvoyés par des serveurs non Microsoft.

Codes de sous-station

Les serveurs IIS 7.0, IIS 7.5 et IIS 8.0 de Microsoft définissent les codes de sous-station HTTP suivants pour indiquer une cause plus spécifique d’une erreur 404:

  • 404.0 – Introuvable.
  • 404.1 – Site Non trouvé.
  • 404.2 – Restriction ISAPI ou CGI.
  • 404.3 – Restriction de type MIME.
  • 404.4 – Aucun gestionnaire configuré.
  • 404.5 – Refusé par la configuration de filtrage des demandes.
  • 404.6 – Verbe refusé.
  • 404.7 – Extension de fichier refusée.
  • 404.8 – Espace de noms caché.
  • 404.9 – Attribut de fichier masqué.
  • 404.10 – En-tête de requête trop long.
  • 404.11 – La requête contient une double séquence d’échappement.
  • 404.12 – La requête contient des caractères à bits élevés.
  • 404.13 – Longueur du contenu trop grande.
  • 404.14 – URL de demande trop longue.
  • 404.15 – Chaîne de requête trop longue.
  • 404.16 – Demande DAV envoyée au gestionnaire de fichiers statiques.
  • 404.17 – Contenu dynamique mappé au gestionnaire de fichiers statiques via un mappage MIME générique.
  • 404.18 – Séquence de chaîne de requête refusée.
  • 404.19 – Refusé par la règle de filtrage.
  • 404.20 – Trop De Segments D’URL.

Pages d’erreur personnalisées

Le message Wikimédia 404

Les serveurs Web peuvent généralement être configurés pour afficher une page d’erreur 404 personnalisée, y compris une description plus naturelle, l’image de marque du site parent et parfois un plan du site, un formulaire de recherche ou un widget de 404 pages. La phrase au niveau du protocole, qui est masquée à l’utilisateur, est rarement personnalisée. Internet Explorer, cependant, n’affichera pas de pages personnalisées à moins qu’elles ne dépassent 512 octets, optant plutôt pour afficher une page d’erreur « conviviale ». Google Chrome a inclus des fonctionnalités similaires, où le 404 est remplacé par des suggestions alternatives générées par les algorithmes de Google, si la page mesure moins de 512 octets. Un autre problème est que si la page ne fournit pas de favicon et qu’une page 404 personnalisée distincte existe, du trafic supplémentaire et des temps de chargement plus longs seront générés à chaque vue de page.

De nombreuses organisations utilisent 404 pages d’erreur comme une occasion d’injecter de l’humour dans ce qui pourrait autrement être un site Web sérieux. Par exemple, Metro UK montre un ours polaire sur une planche à roulettes, et l’agence de développement Web Left Logic a un programme de dessin simple. Pendant la campagne des élections générales britanniques de 2015, les principaux partis politiques ont tous utilisé leurs pages 404 pour viser des opposants politiques ou montrer des politiques pertinentes à des partisans potentiels. En Europe, le projet NotFound, créé par plusieurs organisations européennes, dont Missing Children Europe et Child Focus, encourage les exploitants de sites à ajouter un extrait de code pour servir 404 pages d’erreur personnalisées qui fournissent des données sur les enfants disparus.

Alors que de nombreux sites Web envoient des informations supplémentaires dans un message d’erreur 404 — comme un lien vers la page d’accueil d’un site Web ou une boîte de recherche —, certains s’efforcent également de trouver la bonne page Web souhaitée par l’utilisateur. Des extensions sont disponibles pour certains systèmes de gestion de contenu (CMSS) pour ce faire.

Suivi des erreurs 404

Il existe un certain nombre d’outils qui parcourent un site Web pour trouver des pages qui renvoient des codes d’état 404. Ces outils peuvent être utiles pour trouver des liens qui existent dans un site Web particulier. La limitation de ces outils est qu’ils ne trouvent que des liens dans un site Web particulier et ignorent les 404 résultant de liens sur d’autres sites Web. En conséquence, ces outils manquent 83% des 404 sur les sites Web. Une solution consiste à trouver 404 erreurs en analysant les liens externes.

L’un des moyens les plus efficaces de découvrir 404 erreurs consiste à utiliser Google Search Console, Google Analytics ou un logiciel d’analyse.

Une autre méthode courante consiste à suivre le trafic sur 404 pages à l’aide d’une analyse de fichier journal. Cela peut être utile pour mieux comprendre ce que les utilisateurs de 404s ont atteint sur le site. Une autre méthode de suivi du trafic sur 404 pages consiste à utiliser des outils de suivi du trafic basés sur JavaScript.

Voir aussi

  • Écran bleu de la mort
  • Mise en cache funky
  • Link rot
  • Liste des codes d’état HTTP
  • Un plus utile 404
  • 404 Introuvable du Protocole de transfert Hypertexte (HTTP/1.1): Sémantique et spécification de contenu, à l’Internet Engineering Task Force
  • Directive ErrorDocument – instructions sur les pages d’erreur personnalisées pour le serveur Web Apache 2.0
  • 404: Introuvable – une chanson primée sur le code d’erreur

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.