HTTP 404

“404 non trovato” reindirizza qui. Per l’episodio TV, vedi 404 Non trovato (Mr. Robot).

Il messaggio di errore HTTP 404, 404 Not Found, 404, 404, Page Not Found, File Not Found o Server Not Found è un codice di risposta standard HTTP (Hypertext Transfer Protocol), nelle comunicazioni di rete di computer, per indicare che il browser è stato in grado di comunicare con un determinato server, ma il server non è riuscito a trovare ciò che L’errore può essere utilizzato anche quando un server non desidera rivelare se ha le informazioni richieste.

Il server di hosting del sito Web genererà in genere una pagina Web “404 Not Found” quando un utente tenta di seguire un link rotto o morto; quindi l’errore 404 è uno degli errori più riconoscibili riscontrati sul World Wide Web.

Panoramica

Quando si comunica tramite HTTP, un server è tenuto a rispondere a una richiesta, ad esempio una richiesta del browser Web per una pagina Web, con un codice di risposta numerico e un messaggio facoltativo, obbligatorio o non consentito (in base al codice di stato). Nel codice 404, la prima cifra indica un errore del client, ad esempio un URL (Uniform Resource Locator) digitato in modo errato. Le due cifre seguenti indicano l’errore specifico riscontrato. L’uso di HTTP di codici a tre cifre è simile all’uso di tali codici nei protocolli precedenti come FTP e NNTP. A livello HTTP, un codice di risposta 404 è seguito da una “frase ragione”leggibile dall’uomo. La specifica HTTP suggerisce la frase ” Non trovata “e molti server Web emettono di default una pagina HTML che include sia il codice 404 che la frase” Non trovata”.

Un errore 404 viene spesso restituito quando le pagine sono state spostate o eliminate. Nel primo caso, è meglio utilizzare la mappatura URL o il reindirizzamento URL restituendo una risposta 301 spostata in modo permanente, che può essere configurata nella maggior parte dei file di configurazione del server o tramite la riscrittura dell’URL; nel secondo caso, dovrebbe essere restituito un 410 Gone. Poiché queste due opzioni richiedono una configurazione speciale del server, la maggior parte dei siti Web non ne fa uso.

404 gli errori non devono essere confusi con gli errori DNS, che appaiono quando l’URL specificato fa riferimento a un nome di server che non esiste. Un errore 404 indica che il server stesso è stato trovato, ma che il server non è stato in grado di recuperare la pagina richiesta.

Soft 404 errors

Alcuni siti web segnalano un errore “non trovato” restituendo una pagina Web standard con un codice di risposta “200 OK”, segnalando falsamente che la pagina è stata caricata correttamente; questo è noto come soft 404. Il termine “soft 404” è stato introdotto nel 2004 da Ziv Bar-Yossef et al.

I soft 404 sono problematici per i metodi automatizzati per scoprire se un collegamento è rotto. Alcuni motori di ricerca, come Yahoo e Google, utilizzano processi automatizzati per rilevare soft 404s. Soft 404s può verificarsi a seguito di errori di configurazione quando si utilizza alcuni software server HTTP, ad esempio con il software Apache, quando un documento di errore 404 (specificato in a .htaccess file) è specificato come un percorso assoluto (ad esempio http://example.com/error.html) piuttosto che un percorso relativo (/errore.HTML). Questo può anche essere fatto per forza con alcuni browser (come Internet Explorer) per visualizzare un messaggio di errore 404 personalizzata piuttosto che la sostituzione di ciò che viene servito con un browser specifico “amichevole” messaggio di errore (in Internet Explorer, questo comportamento viene attivato quando un 404 è servita e la ricevuta HTML è più breve di lunghezza, e può essere disattivato manualmente dall’utente).

Ci sono anche errori “soft 3XX” in cui il contenuto viene restituito con uno stato 200 ma proviene da una pagina reindirizzata, ad esempio quando le pagine mancanti vengono reindirizzate alla root/home page del dominio.

Server proxy

Alcuni server proxy generano un errore 404 quando un codice di errore di intervallo 500 sarebbe più corretto. Se il server proxy non è in grado di soddisfare una richiesta per una pagina a causa di un problema con l’host remoto (ad esempio errori di risoluzione del nome host o connessioni TCP rifiutate), questo dovrebbe essere descritto come un errore del server interno 5xx, ma potrebbe fornire invece un 404. Questo può confondere i programmi che si aspettano e agiscono su risposte specifiche, in quanto non possono più facilmente distinguere tra un server Web assente e una pagina Web mancante su un server Web presente.

Intenzionale 404s

Nel luglio 2004, il fornitore di telecomunicazioni britannico BT Group ha implementato il sistema di blocco dei contenuti Cleanfeed, che restituisce un errore 404 a qualsiasi richiesta di contenuto identificato come potenzialmente illegale da Internet Watch Foundation. Altri ISP restituiscono un errore HTTP 403 “proibito” nelle stesse circostanze. La pratica di impiegare falsi errori 404 come mezzo per nascondere la censura è stata segnalata anche in Thailandia e Tunisia. In Tunisia, dove la censura era severa prima della rivoluzione del 2011, la gente è venuta a conoscenza della natura dei falsi errori 404 e ha creato un personaggio immaginario chiamato “Ammar 404” che rappresenta “il censore invisibile”.

Microsoft Internet Server 404 substatus error codes

Il software webserver sviluppato da Microsoft, Microsoft Internet Information Services (IIS), restituisce un set di codici substatus con le sue 404 risposte. I codici substatus assumono la forma di numeri decimali aggiunti al codice di stato 404. I codici substatus non sono riconosciuti ufficialmente da IANA e non vengono restituiti da server non Microsoft.

Codici Substatus

I server IIS 7.0, IIS 7.5 e IIS 8.0 di Microsoft definiscono i seguenti codici substatus HTTP per indicare una causa più specifica di un errore 404:

  • 404.0 – Non trovato.
  • 404.1 – Sito non trovato.
  • 404.2 – Restrizione ISAPI o CGI.
  • 404.3 – Restrizione del tipo MIME.
  • 404.4-Nessun gestore configurato.
  • 404.5 – Negato dalla configurazione del filtro delle richieste.
  • 404.6 – Verbo negato.
  • 404.7 – Estensione file negata.
  • 404.8-Spazio dei nomi nascosto.
  • 404.9 – Attributo file nascosto.
  • 404.10 – Intestazione richiesta troppo lunga.
  • 404.11 – La richiesta contiene una doppia sequenza di escape.
  • 404.12 – La richiesta contiene caratteri ad alto bit.
  • 404.13 – Lunghezza del contenuto troppo grande.
  • 404.14 – Richiesta URL troppo lungo.
  • 404.15 – Stringa di query troppo lunga.
  • 404.16 – Richiesta DAV inviata al gestore file statico.
  • 404.17-Contenuto dinamico mappato al gestore file statico tramite una mappatura MIME con caratteri jolly.
  • 404.18 – Sequenza stringa di query negata.
  • 404.19-Negato dalla regola di filtraggio.
  • 404.20 – Troppi segmenti URL.

Pagine di errore personalizzate

Il messaggio Wikimedia 404

I server Web possono in genere essere configurati per visualizzare una pagina di errore 404 personalizzata, inclusa una descrizione più naturale, il marchio del sito principale e talvolta una mappa del sito, un modulo di ricerca o un widget di 404 pagine. La frase a livello di protocollo, che è nascosta all’utente, è raramente personalizzata. Internet Explorer, tuttavia, non visualizzerà pagine personalizzate a meno che non siano più grandi di 512 byte, optando invece per visualizzare una pagina di errore “amichevole”. Google Chrome ha incluso funzionalità simili, in cui il 404 viene sostituito con suggerimenti alternativi generati dagli algoritmi di Google, se la pagina è inferiore a 512 byte di dimensione. Un altro problema è che se la pagina non fornisce una favicon e esiste una pagina personalizzata separata di 404, verranno generati traffico extra e tempi di caricamento più lunghi in ogni visualizzazione di pagina.

Molte organizzazioni utilizzano 404 pagine di errore come un’opportunità per iniettare umorismo in quello che potrebbe altrimenti essere un sito web serio. Ad esempio, Metro UK mostra un orso polare su uno skateboard e l’agenzia di sviluppo web Left Logic ha un semplice programma di disegno. Durante la campagna elettorale generale del Regno Unito del 2015, i principali partiti politici hanno utilizzato tutte le loro 404 pagine per prendere di mira gli avversari politici o mostrare politiche pertinenti ai potenziali sostenitori. In Europa, il progetto NotFound, creato da più organizzazioni europee tra cui Missing Children Europe e Child Focus, incoraggia gli operatori del sito ad aggiungere un frammento di codice per servire 404 pagine di errore personalizzate che forniscono dati sui bambini scomparsi.

Mentre molti siti web inviano informazioni aggiuntive in un messaggio di errore 404, come un link alla home page di un sito web o una casella di ricerca, alcuni cercano anche di trovare la pagina Web corretta desiderata dall’utente. Le estensioni sono disponibili per alcuni sistemi di gestione dei contenuti (CMS) per fare questo.

Monitoraggio degli errori 404

Esistono numerosi strumenti che scansionano un sito Web per trovare pagine che restituiscono codici di stato 404. Questi strumenti possono essere utili per trovare link che esistono all’interno di un particolare sito web. La limitazione di questi strumenti è che trovano solo link all’interno di un particolare sito web e ignorano 404s derivanti da link su altri siti web. Di conseguenza, questi strumenti perdono l ‘ 83% dei 404 sui siti web. Un modo per aggirare questo è trovare 404 errori analizzando i collegamenti esterni.

Uno dei modi più efficaci per scoprire gli errori 404 è utilizzando Google Search Console, Google Analytics o software di scansione.

Un altro metodo comune è il monitoraggio del traffico a 404 pagine utilizzando l’analisi dei file di registro. Questo può essere utile per capire di più su ciò che gli utenti di 404s hanno raggiunto sul sito. Un altro metodo di monitoraggio del traffico a 404 pagine utilizza strumenti di monitoraggio del traffico basati su JavaScript.

Vedi anche

  • schermo Blu della morte
  • Funky cache
  • Link rot
  • Elenco dei codici di stato HTTP
  • Più Utile 404
  • 404 Non Trovato il Hypertext Transfer Protocol (HTTP/1.1): Semantica e la definizione del Contenuto, della Internet Engineering Task Force
  • Direttiva ErrorDocument – istruzioni sulle pagine di errore personalizzate per l’Apache 2.0, web server
  • 404: Non Trovato premiato come canzone il codice di errore

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.