HTTP 404

“404 Nem található” átirányítások itt. A tévés epizódról lásd: 404 Nem található (Mr. Robot).

a HTTP 404, 404 Not Found, 404, 404 Error, Page Not Found, File Not Found, or Server Not Found hibaüzenet egy hipertext Transfer Protocol (HTTP) szabványos válaszkód, a számítógépes hálózati kommunikációban, jelezve, hogy a böngésző képes volt kommunikálni egy adott kiszolgálóval, de a kiszolgáló nem találta meg a kért információt. A hiba akkor is használható, ha a szerver nem kívánja nyilvánosságra hozni, hogy rendelkezik-e a kért információval.

a weboldal hosting szerver általában generál egy “404 Not Found” weboldalt, amikor a felhasználó megpróbál követni egy törött vagy halott linket; ezért a 404 hiba az egyik legismertebb hiba, amelyet a világhálón találtak.

áttekintés

HTTP-n keresztüli kommunikáció esetén a kiszolgálónak válaszolnia kell egy kérésre, például egy weblapra vonatkozó webböngésző-kérésre, numerikus válaszkóddal és egy opcionális, kötelező vagy (az állapotkód alapján) nem engedélyezett üzenettel. A 404-es kódban az első számjegy egy ügyfélhibát jelez, például egy elgépelt egységes erőforrás-lokátort (URL). A következő két számjegy jelzi a felmerült hibát. A HTTP háromjegyű kódjainak használata hasonló a korábbi protokollokban, mint például az FTP és az NNTP. HTTP szinten a 404-es válaszkódot egy ember által olvasható “okmondat”követi. A HTTP specifikáció a “Nem található” kifejezést javasolja, és sok webszerver alapértelmezés szerint olyan HTML oldalt bocsát ki, amely mind a 404-es kódot, mind a “Nem található” kifejezést tartalmazza.

az oldalak áthelyezésekor vagy törlésekor gyakran 404-es hiba jelenik meg. Az első esetben jobb URL-leképezést vagy URL-átirányítást alkalmazni egy 301 Véglegesen áthelyezett válasz visszaküldésével, amely a legtöbb szerver konfigurációs fájlban konfigurálható, vagy URL-átírással; a második esetben a 410 eltűnt vissza kell adni. Mivel ez a két lehetőség speciális szerver konfigurációt igényel, a legtöbb webhely nem használja őket.

404 a hibákat nem szabad összetéveszteni a DNS-hibákkal, amelyek akkor jelennek meg, amikor az adott URL nem létező kiszolgálónévre utal. A 404-es hiba azt jelzi, hogy maga a kiszolgáló található, de a kiszolgáló nem tudta letölteni a kért oldalt.

Soft 404 hibák

egyes webhelyek “nem található” hibát jelentenek egy “200 OK” válaszkóddal ellátott szabványos weboldal visszaküldésével, hamisan jelentve, hogy az oldal megfelelően van betöltve; ez az úgynevezett soft 404. A “soft 404” kifejezést 2004-ben vezette be Ziv Bar-Yossef et al.

a puha 404-esek problematikusak az automatizált módszerekkel annak kiderítésére, hogy egy kapcsolat megszakadt-e. Egyes keresőmotorok, mint például a Yahoo és a Google, automatizált folyamatokat használnak a soft 404s észlelésére. a Soft 404s konfigurációs hibák eredményeként fordulhat elő bizonyos HTTP szerver szoftverek használatakor, például az Apache szoftverrel, amikor egy 404-es Hibadokumentum (a .htaccess fájl) abszolút elérési útként van megadva (pl. http://example.com/error.html), nem pedig relatív elérési útként (/hiba.html). Ezt szándékosan is meg lehet tenni, hogy egyes böngészőket (például az Internet Explorert) arra kényszerítsenek, hogy testreszabott 404-es hibaüzenetet jelenítsenek meg, ahelyett, hogy a kiszolgálottakat egy böngészőspecifikus “barátságos” hibaüzenettel helyettesítenék (az Internet Explorerben ez a viselkedés akkor aktiválódik, amikor egy 404-es kiszolgálásra kerül, és a kapott HTML rövidebb, mint egy bizonyos hosszúság, és a felhasználó manuálisan letilthatja).

vannak olyan “soft 3xx” hibák is, amikor a tartalom 200-as állapotú, de átirányított oldalról származik, például amikor a hiányzó oldalakat átirányítják a domain gyökér/kezdőlapjára.

proxykiszolgálók

egyes proxykiszolgálók 404-es hibát generálnak, ha egy 500 tartományú hibakód helyesebb lenne. Ha a proxykiszolgáló nem tudja kielégíteni egy oldalkérést a távoli gazdagép problémája miatt (például hostname resolution failures vagy elutasított TCP kapcsolatok), akkor ezt 5xx belső szerver hibának kell tekinteni, de lehet, hogy 404-et ad. Ez összezavarhatja azokat a programokat, amelyek konkrét válaszokat várnak és cselekszenek, mivel már nem tudnak könnyen megkülönböztetni egy hiányzó webszervert és egy hiányzó weblapot egy jelen lévő webszerveren.

intencional 404s

2004 júliusában az Egyesült Királyság távközlési szolgáltatója, a BT Group telepítette a Cleanfeed tartalomblokkoló rendszert, amely 404-es hibát ad vissza minden olyan tartalomkéréshez, amelyet az Internet Watch Foundation potenciálisan illegálisnak minősített. Más internetszolgáltatók hasonló körülmények között HTTP 403 “tiltott” hibát adnak vissza. Thaiföldön és Tunéziában is beszámoltak arról a gyakorlatról, hogy hamis 404-es hibákat alkalmaznak a cenzúra elrejtésére. Tunéziában, ahol a cenzúra súlyos volt a 2011-es forradalom előtt, az emberek tudomást szereztek a hamis 404-es hibák természetéről, és létrehoztak egy “Ammar 404” nevű képzeletbeli karaktert, aki a “láthatatlan cenzort”képviseli.

Microsoft Internet Server 404 substatus hibakódok

a Microsoft, a Microsoft Internet Information Services (IIS) által kifejlesztett webszerverszoftver 404 válaszú substatus kódkészletet ad vissza. Az alállapot-kódok a 404-es állapotkódhoz csatolt decimális számok formájában jelennek meg. Az alállomás-kódokat az IANA hivatalosan nem ismeri fel,és nem Microsoft-kiszolgálók nem adják vissza.

Alállomáskódok

a Microsoft IIS 7.0, IIS 7.5 és IIS 8.0 kiszolgálói a következő HTTP alállomáskódokat határozzák meg a 404-es hiba konkrétabb okának jelzésére:

  • 404.0 – Nem található.
  • 404.1 – A Webhely Nem Található.
  • 404.2 – ISAPI vagy CGI korlátozás.
  • 404.3 – MIME típusú korlátozás.
  • 404.4 – nincs kezelő konfigurálva.
  • 404.5 – elutasítva a kérelemszűrő konfigurációval.
  • 404.6 – ige megtagadva.
  • 404.7 – fájlkiterjesztés megtagadva.
  • 404.8 – rejtett névtér.
  • 404.9 – Fájl attribútum rejtett.
  • 404.10 – a fejléc kérése túl hosszú.
  • 404.11 – a kérés kettős menekülési sorrendet tartalmaz.
  • 404.12 – a kérés nagy bites karaktereket tartalmaz.
  • 404.13 – A tartalom hossza túl nagy.
  • 404.14 – az URL kérése túl hosszú.
  • 404.15 – a lekérdezési karakterlánc túl hosszú.
  • 404.16 – DAV kérés elküldve a statikus fájlkezelőnek.
  • 404.17 – dinamikus tartalom leképezve a statikus fájlkezelőhöz helyettesítő MIME leképezéssel.
  • 404.18 – lekérdezési karakterlánc-sorozat megtagadva.
  • 404.19 – szűrési szabály által megtagadva.
  • 404.20 – túl sok URL-szegmens.

egyéni hibaoldalak

a Wikimédia 404 üzenete

a webkiszolgálók általában úgy konfigurálhatók, hogy megjelenítsenek egy személyre szabott 404-es hibalapot, beleértve egy természetesebb leírást, a szülő webhely márkajelzését, és néha webhelytérképet, keresési űrlapot vagy 404 oldalas widgetet. A felhasználó elől rejtett protokollszintű kifejezést ritkán testreszabják. Az Internet Explorer azonban csak akkor jelenít meg egyéni oldalakat, ha azok nagyobbak, mint 512 bájt, ehelyett egy “barátságos” hibaoldal megjelenítését választja. A Google Chrome hasonló funkciókat tartalmazott, ahol a 404-et a Google algoritmusai által generált alternatív javaslatok váltják fel, ha az oldal mérete 512 bájt alatt van. Egy másik probléma az, hogy ha az oldal nem tartalmaz favicont, és külön egyéni 404-oldal létezik, akkor minden oldalnézetben extra forgalom és hosszabb betöltési idő keletkezik.

sok szervezet 404 hibaoldalt használ arra, hogy humort fecskendezzen be az egyébként komoly weboldalba. Például a Metro UK jegesmedvét mutat egy gördeszkán, a Left Logic webfejlesztő ügynökség pedig egy egyszerű rajzprogrammal rendelkezik. Közben 2015-ös brit általános választási kampány a fő politikai pártok mind 404 oldalukat arra használták, hogy vagy politikai ellenfeleket célozzanak meg, vagy releváns politikákat mutassanak be a potenciális támogatóknak. Európában a NotFound projekt, amelyet több európai szervezet, köztük a Missing Children Europe és a Child Focus hozott létre, arra ösztönzi a webhely üzemeltetőit, hogy adjanak hozzá egy kódrészletet a testreszabott 404 hibaoldalak kiszolgálásához, amelyek adatokat szolgáltatnak az eltűnt gyermekekről.

míg sok webhely további információkat küld egy 404—es hibaüzenetben—például egy weboldal kezdőlapjára mutató linket vagy keresőmezőt -, egyesek arra is törekszenek, hogy megtalálják a felhasználó által kívánt megfelelő weboldalt. Bővítmények állnak rendelkezésre néhány tartalomkezelő rendszerhez (CMS) ehhez.

404-es hibák nyomon követése

számos eszköz létezik, amelyek feltérképezik a webhelyet, hogy megtalálják a 404-es állapotkódokat visszaadó oldalakat. Ezek az eszközök hasznosak lehetnek egy adott webhelyen létező linkek megtalálásában. Ezeknek az eszközöknek az a korlátja, hogy csak egy adott webhelyen találnak linkeket, és figyelmen kívül hagyják a más webhelyeken található linkekből származó 404S-t. Ennek eredményeként ezek az eszközök kihagyják a weboldalak 83% – át a 404-ekből. Ennek egyik módja a 404 hiba megtalálása a külső linkek elemzésével.

a 404-es hibák felfedezésének egyik leghatékonyabb módja a Google Search Console, a Google Analytics vagy a feltérképező szoftver használata.

egy másik gyakori módszer a forgalom 404 oldalra történő nyomon követése naplófájl-elemzéssel. Ez hasznos lehet annak megértéséhez, hogy a 404S felhasználók mit értek el a webhelyen. A forgalom 404 oldalra történő nyomon követésének másik módja a JavaScript-alapú forgalomkövető eszközök használata.

Lásd még

  • halál kék képernyője
  • Funky gyorsítótár
  • Link rot
  • HTTP állapotkódok listája
  • egy hasznosabb 404
  • 404 Nem található a Hypertext Transfer Protocol (HTTP/1.1): szemantika és tartalom specifikáció, az Internet Engineering Task Force
  • ErrorDocument Direktíva-utasítások az Apache 2.0 webkiszolgáló egyedi hibalapjain
  • 404: Nem található-díjnyertes dal a hibakódról

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.