HTTP 404

„404 nicht gefunden“ leitet hier weiter. Für die TV-Folge siehe 404 Not Found (Mr. Robot).

Die Fehlermeldung HTTP 404, 404 Not Found, 404, 404 Error, Page Not Found, File Not Found oder Server Not Found ist ein HTTP-Standardantwortcode (Hypertext Transfer Protocol) in der Computernetzwerkkommunikation, der anzeigt, dass der Browser mit einem bestimmten Server kommunizieren konnte, der Server jedoch nicht finden konnte, was angefordert wurde. Der Fehler kann auch verwendet werden, wenn ein Server nicht offenlegen möchte, ob er über die angeforderten Informationen verfügt.

Der Website-Hosting-Server generiert normalerweise eine „404 Not Found“ -Webseite, wenn ein Benutzer versucht, einem defekten oder toten Link zu folgen. Daher ist der 404-Fehler einer der bekanntesten Fehler, die im World Wide Web auftreten.

Übersicht

Bei der Kommunikation über HTTP muss ein Server auf eine Anforderung, z. B. eine Webbrowseranforderung für eine Webseite, mit einem numerischen Antwortcode und einer optionalen, obligatorischen oder unzulässigen Nachricht (basierend auf dem Statuscode) antworten. In Code 404 gibt die erste Ziffer einen Clientfehler an, z. B. eine falsch eingegebene URL (Uniform Resource Locator). Die folgenden zwei Ziffern geben den aufgetretenen spezifischen Fehler an. Die Verwendung von dreistelligen Codes durch HTTP ähnelt der Verwendung solcher Codes in früheren Protokollen wie FTP und NNTP. Auf HTTP-Ebene folgt auf einen 404-Antwortcode eine lesbare „Reason Phrase“. Die HTTP-Spezifikation schlägt den Ausdruck „Nicht gefunden“ vor, und viele Webserver geben standardmäßig eine HTML-Seite aus, die sowohl den 404-Code als auch den Ausdruck „Nicht gefunden“ enthält.

Ein 404-Fehler wird häufig zurückgegeben, wenn Seiten verschoben oder gelöscht wurden. Im ersten Fall ist es besser, URL-Mapping oder URL-Umleitung zu verwenden, indem eine 301 Moved Permanently-Antwort zurückgegeben wird, die in den meisten Serverkonfigurationsdateien konfiguriert werden kann, oder durch URL-Rewriting; Im zweiten Fall sollte eine 410 Gone zurückgegeben werden. Da diese beiden Optionen eine spezielle Serverkonfiguration erfordern, werden sie von den meisten Websites nicht verwendet.

404-Fehler sollten nicht mit DNS-Fehlern verwechselt werden, die auftreten, wenn die angegebene URL auf einen Servernamen verweist, der nicht existiert. Ein 404-Fehler zeigt an, dass der Server selbst gefunden wurde, der Server die angeforderte Seite jedoch nicht abrufen konnte.

Soft 404-Fehler

Einige Websites melden einen Fehler „Nicht gefunden“, indem sie eine Standardwebseite mit einem Antwortcode „200 OK“ zurückgeben und fälschlicherweise melden, dass die Seite ordnungsgemäß geladen wurde. Dies wird als Soft 404 bezeichnet. Der Begriff „Soft 404“ wurde 2004 von Ziv Bar-Yossef et al.

Soft 404s sind problematisch für automatisierte Methoden, um festzustellen, ob eine Verbindung unterbrochen ist. Einige Suchmaschinen, wie Yahoo und Google, verwenden automatisierte Prozesse, um Soft 404s zu erkennen. Soft 404s können als Folge von Konfigurationsfehlern auftreten, wenn bestimmte HTTP-Server-Software verwendet wird, beispielsweise mit der Apache-Software, wenn ein Fehlerdokument 404 (angegeben in a.htaccess-Datei) wird als absoluter Pfad (z. B. http://example.com/error.html) und nicht als relativer Pfad (/) angegeben.HTML). Dies kann auch absichtlich geschehen, um einige Browser (wie Internet Explorer) zu zwingen, eine angepasste 404-Fehlermeldung anzuzeigen, anstatt das, was bereitgestellt wird, durch eine browserspezifische „freundliche“ Fehlermeldung zu ersetzen (in Internet Explorer wird dieses Verhalten ausgelöst, wenn ein 404 bereitgestellt wird und der empfangene HTML-Code kürzer als eine bestimmte Länge ist und vom Benutzer manuell deaktiviert werden kann).

Es gibt auch „Soft 3XX“ -Fehler, bei denen Inhalt mit dem Status 200 zurückgegeben wird, aber von einer umgeleiteten Seite stammt, z. B. wenn fehlende Seiten zur Domänenstamm- / Startseite umgeleitet werden.

Proxyserver

Einige Proxyserver erzeugen einen 404-Fehler, wenn ein 500-Fehlercode korrekter wäre. Wenn der Proxyserver eine Anforderung für eine Seite aufgrund eines Problems mit dem Remote-Host (z. B. Hostnamenauflösungsfehler oder abgelehnte TCP-Verbindungen) nicht erfüllen kann, sollte dies als interner 5xx-Serverfehler beschrieben werden, kann jedoch stattdessen einen 404 liefern. Dies kann Programme verwirren, die bestimmte Antworten erwarten und darauf reagieren, da sie nicht mehr leicht zwischen einem abwesenden Webserver und einer fehlenden Webseite auf einem vorhandenen Webserver unterscheiden können.

Im Juli 2004 setzte der britische Telekommunikationsanbieter BT Group das Cleanfeed Content Blocking System ein, das bei jeder Anfrage nach Inhalten, die von der Internet Watch Foundation als potenziell illegal eingestuft wurden, einen 404-Fehler zurückgibt. Andere ISPs geben unter denselben Umständen den HTTP 403-Fehler „verboten“ zurück. Die Praxis, gefälschte 404-Fehler zu verwenden, um die Zensur zu verbergen, wurde auch in Thailand und Tunesien gemeldet. In Tunesien, wo die Zensur vor der Revolution von 2011 streng war, wurden die Menschen auf die Natur der gefälschten 404-Fehler aufmerksam und schufen eine imaginäre Figur namens „Ammar 404“, die „den unsichtbaren Zensor“ darstellt.

Microsoft Internet Server 404 substatus error codes

Die von Microsoft entwickelte Webserver-Software, Microsoft Internet Information Services (IIS), gibt einen Satz von Substatus-Codes mit seinen 404 Antworten zurück. Die Substatuscodes haben die Form von Dezimalzahlen, die an den 404-Statuscode angehängt sind. Die Substatuscodes werden von IANA nicht offiziell erkannt und von Nicht-Microsoft-Servern nicht zurückgegeben.

Unterstatuscodes

Die IIS 7.0-, IIS 7.5- und IIS 8.0-Server von Microsoft definieren die folgenden HTTP-Unterstatuscodes, um eine spezifischere Ursache für einen 404-Fehler anzugeben:

  • 404.0 – Nicht gefunden.
  • 404.1 – Seite nicht gefunden.
  • 404.2 – ISAPI- oder CGI-Einschränkung.
  • 404.3 – Einschränkung des MIME-Typs.
  • 404.4 – Kein Handler konfiguriert.
  • 404.5 – Verweigert durch Anforderungsfilterkonfiguration.
  • 404.6 – Verb abgelehnt.
  • 404.7 – Dateierweiterung verweigert.
  • 404.8 – Versteckter Namespace.
  • 404.9 – Dateiattribut ausgeblendet.
  • 404.10 – Anforderungsheader zu lang.
  • 404.11 – Anforderung enthält doppelte Escape-Sequenz.
  • 404.12 – Anfrage enthält High-Bit-Zeichen.
  • 404.13 – Inhaltslänge zu groß.
  • 404.14 – Anfrage-URL zu lang.
  • 404.15 – Abfragezeichenfolge zu lang.
  • 404.16 – DAV-Anforderung an den statischen Dateihandler gesendet.
  • 404.17 – Dynamischer Inhalt, der über ein Platzhalter-MIME-Mapping dem statischen Dateihandler zugeordnet wird.
  • 404.18 – Abfragezeichenfolge verweigert.
  • 404.19 – Durch Filterregel abgelehnt.
  • 404.20 – Zu viele URL-Segmente.

Benutzerdefinierte Fehlerseiten

Die Wikimedia 404-Nachricht

Webserver können in der Regel so konfiguriert werden, dass eine benutzerdefinierte 404-Fehlerseite angezeigt wird, einschließlich einer natürlicheren Beschreibung, des Brandings der übergeordneten Site und manchmal einer Sitemap, eines Suchformulars oder eines 404-Seiten-Widgets. Die Phrase auf Protokollebene, die dem Benutzer verborgen bleibt, wird selten angepasst. Internet Explorer zeigt jedoch keine benutzerdefinierten Seiten an, es sei denn, sie sind größer als 512 Byte, Stattdessen wird eine „freundliche“ Fehlerseite angezeigt. Google Chrome enthielt ähnliche Funktionen, bei denen die 404 durch alternative Vorschläge ersetzt wird, die von Google-Algorithmen generiert werden, wenn die Seite weniger als 512 Byte groß ist. Ein weiteres Problem besteht darin, dass, wenn die Seite kein Favicon bereitstellt und eine separate benutzerdefinierte 404-Seite vorhanden ist, bei jedem Seitenaufruf zusätzlicher Datenverkehr und längere Ladezeiten generiert werden.

Viele Organisationen nutzen 404-Fehlerseiten als Gelegenheit, Humor in eine ansonsten seriöse Website zu bringen. Zum Beispiel zeigt Metro UK einen Eisbären auf einem Skateboard, und die Webentwicklungsagentur Left Logic hat ein einfaches Zeichenprogramm. Während des britischen Parlamentswahlkampfs 2015 nutzten die wichtigsten politischen Parteien ihre 404 Seiten, um entweder auf politische Gegner zu zielen oder potenziellen Anhängern relevante Richtlinien zu zeigen. In Europa ermutigt das NotFound-Projekt, das von mehreren europäischen Organisationen wie Missing Children Europe und Child Focus ins Leben gerufen wurde, Seitenbetreiber, einen Codeausschnitt hinzuzufügen, um benutzerdefinierte 404-Fehlerseiten bereitzustellen, die Daten über vermisste Kinder enthalten.

Während viele Websites zusätzliche Informationen in einer 404-Fehlermeldung senden — z. B. einen Link zur Startseite einer Website oder ein Suchfeld -, bemühen sich einige auch, die richtige Webseite zu finden, die der Benutzer wollte. Für einige Content Management Systeme (CMS) stehen hierfür Erweiterungen zur Verfügung.

Verfolgung von 404-Fehlern

Es gibt eine Reihe von Tools, die eine Website durchsuchen, um Seiten zu finden, die 404-Statuscodes zurückgeben. Diese Tools können hilfreich sein, um Links zu finden, die auf einer bestimmten Website vorhanden sind. Die Einschränkung dieser Tools besteht darin, dass sie nur Links innerhalb einer bestimmten Website finden und 404s ignorieren, die sich aus Links auf anderen Websites ergeben. Infolgedessen verpassen diese Tools 83% der 404 auf Websites. Eine Möglichkeit, dies zu umgehen, besteht darin, 404-Fehler durch Analyse externer Links zu finden.

Eine der effektivsten Möglichkeiten, 404-Fehler zu entdecken, ist die Verwendung von Google Search Console, Google Analytics oder Crawling-Software.

Eine weitere gängige Methode ist die Verfolgung des Datenverkehrs auf 404 Seiten mithilfe der Protokolldateianalyse. Dies kann nützlich sein, um mehr darüber zu erfahren, was 404s-Benutzer auf der Website erreicht haben. Eine weitere Methode zur Verfolgung des Datenverkehrs auf 404-Seiten ist die Verwendung von JavaScript-basierten Traffic-Tracking-Tools.

Siehe auch

  • Blauer Bildschirm des Todes
  • Funky Caching
  • Link rot
  • Liste der HTTP-Statuscodes
  • Eine nützlichere 404
  • 404 nicht gefunden des Hypertext Transfer Protocol (HTTP / 1.1): Semantik und Inhaltsspezifikation bei der Internet Engineering Task Force
  • ErrorDocument Direktive – Anweisungen zu benutzerdefinierten Fehlerseiten für den Apache 2.0 Webserver
  • 404: Nicht gefunden – ein preisgekröntes Lied über den Fehlercode

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.