Analiza frecvenței

într-un cifru simplu de substituție, fiecare literă a textului clar este înlocuită cu alta și orice literă particulară din textul clar va fi întotdeauna transformată în aceeași literă din textul cifrat. De exemplu, dacă toate aparițiile literei e se transformă în litera X, un mesaj de text cifrat care conține numeroase instanțe ale literei X ar sugera unui criptanalist că X reprezintă e.

utilizarea de bază a analizei frecvenței este de a număra mai întâi frecvența literelor de text cifrat și apoi de a asocia literele de text clar ghicite cu ele. Mai multe Xs în textul cifrat decât orice altceva sugerează că X corespunde e în textul clar, dar acest lucru nu este sigur; t și a sunt, de asemenea, foarte frecvente în engleză, deci X ar putea fi și oricare dintre ele. Este puțin probabil să fie un text clar z sau q care sunt mai puțin frecvente. Astfel, criptanalistul ar putea avea nevoie să încerce mai multe combinații de mapări între litere cifrate și litere plaintext.

poate fi concepută o utilizare mai complexă a statisticilor, cum ar fi luarea în considerare a numărului de perechi de Litere (bigrame), triplete (trigrame) și așa mai departe. Acest lucru se face pentru a oferi mai multe informații criptanalistului, de exemplu, Q și U apar aproape întotdeauna împreună în această ordine în limba engleză, chiar dacă Q în sine este rar.

un exempluedit

să presupunem că Eve a interceptat criptograma de mai jos și se știe că este criptată folosind un simplu cifru de substituție după cum urmează:

LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIMWQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJGSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXVIZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLEPPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPPXLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX

pentru acest exemplu, literele mari sunt folosite pentru a desemna textul cifrat, literele mici sunt folosite pentru a desemna textul clar (sau presupuneri la astfel de) și X~t este folosit pentru a exprima o presupunere că litera cifrată X reprezintă litera plaintext t.

Eve ar putea folosi analiza frecvenței pentru a ajuta la rezolvarea mesajului de-a lungul următoarelor linii: numărul literelor din criptogramă arată că I este cea mai comună literă unică, XL cea mai comună bigramă, iar XLI este cea mai comună trigramă. e este cea mai comună literă în limba engleză, th este cel mai comun bigram, iar este cel mai comun trigram. Acest lucru sugerează cu tărie că X~t, L~h și i~e. a doua literă cea mai comună din criptogramă este E; deoarece prima și a doua litere cele mai frecvente în limba engleză, e și t sunt contabilizate, Eve ghicește că E~a, a treia literă cea mai frecventă. Făcând provizoriu aceste ipoteze, se obține următorul mesaj parțial decriptat.

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReMWQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJGSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtVeZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMthaPPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPPthMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt

folosind aceste presupuneri inițiale, Eva poate observa modele care îi confirmă alegerile, cum ar fi „asta”. Mai mult, alte modele sugerează presupuneri suplimentare. „Rtate „ar putea fi” stat”, ceea ce ar însemna R~s. în mod similar,” atthattMZe „ar putea fi ghicit ca” atthattime”, producând M~i și Z~m. Mai mult,” heVe „ar putea fi” aici”, dând V~r. Completarea acestor presupuneri, Eva devine:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGaseiWQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJGSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtremitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQithaPPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPPthiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit

la rândul lor, aceste presupuneri sugerează încă altele (de exemplu, „remarA” ar putea fi „remarcă”, implicând A~k) și așa mai departe și este relativ simplu să deducem restul literelor, rezultând în cele din urmă textul clar.

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscaseinwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsofcourseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextremityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywithalltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingallthingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit

în acest moment, ar fi o idee bună pentru Eve să introducă spații și semne de punctuație:

Hereupon Legrand arose, with a grave and stately air, and brought me the beetlefrom a glass case in which it was enclosed. It was a beautiful scarabaeus, and, atthat time, unknown to naturalists—of course a great prize in a scientific pointof view. There were two round black spots near one extremity of the back, and along one near the other. The scales were exceedingly hard and glossy, with all theappearance of burnished gold. The weight of the insect was very remarkable, and,taking all things into consideration, I could hardly blame Jupiter for his opinionrespecting it.

în acest exemplu din Bug-ul de aur, presupunerile Evei au fost toate corecte. Totuși, acest lucru nu ar fi întotdeauna cazul; variația statisticilor pentru textele individuale poate însemna că presupunerile inițiale sunt incorecte. Poate fi necesar să se retragă presupunerile incorecte sau să se analizeze statisticile disponibile cu mult mai multă profunzime decât justificările oarecum simplificate date în exemplul de mai sus.

de asemenea, este posibil ca textul clar să nu prezinte distribuția așteptată a frecvențelor literelor. Mesajele mai scurte sunt susceptibile de a arăta mai multe variații. De asemenea, este posibil să se construiască texte înclinate artificial. De exemplu, au fost scrise romane întregi care omit litera „e” cu totul — o formă de literatură cunoscută sub numele de lipogramă.

un exempluedit

Lasă un răspuns Anulează răspunsul