Frekvensanalyse

i en simpel substitutionskryptering erstattes hvert bogstav i almindelig tekst med et andet, og ethvert bestemt bogstav i almindelig tekst vil altid blive omdannet til det samme bogstav i chifferteksten. For eksempel, hvis alle forekomster af bogstavet e bliver til bogstavet H, vil en krypteringstekstmeddelelse, der indeholder adskillige forekomster af bogstavet H, foreslå en kryptanalytiker, der repræsenterer e.

den grundlæggende anvendelse af frekvensanalyse er først at tælle hyppigheden af krypteringstekstbogstaver og derefter knytte gættede almindelige tekstbogstaver til dem. Mere end noget andet tyder på, at det svarer til e i almindelig tekst, men det er ikke sikkert; t og a er også meget almindelige på engelsk, så det kan også være en af dem. Det er usandsynligt, at det er en almindelig tekst, der er mindre almindelig. Således kan kryptanalytikeren muligvis prøve flere kombinationer af kortlægninger mellem krypteringstekst og almindelig tekstbogstaver.

mere kompleks brug af statistikker kan udtænkes, såsom at overveje tællinger af par bogstaver (bigrams), tripletter (trigrams) og så videre. Dette gøres for at give mere information til kryptanalytikeren, for eksempel forekommer spørgsmål og U næsten altid sammen i den rækkefølge på engelsk, selvom spørgsmål i sig selv er sjældent.

et eksempelrediger

Antag, at Eve har opfanget kryptogrammet nedenfor, og det vides at være krypteret ved hjælp af en simpel substitutionskryptering som følger:

LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIMWQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJGSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXVIZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLEPPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPPXLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX

i dette eksempel bruges store bogstaver til at betegne chiffertekst, små bogstaver bruges til at betegne almindelig tekst (eller gæt på sådan), og H~T bruges til at udtrykke et gæt om, at chiffertekstbogstav h repræsenterer almindelig tekstbogstav t.

Eve kunne bruge frekvensanalyse til at hjælpe med at løse meddelelsen i følgende linjer: tællinger af bogstaverne i kryptogrammet viser, at jeg er det mest almindelige enkeltbogstav, det mest almindelige bigram, og det mest almindelige trigram. e er det mest almindelige bogstav på engelsk, th er den mest almindelige bigram, og er den mest almindelige trigram. Det næst mest almindelige bogstav i kryptogrammet er E; da de første og næsthyppigste bogstaver på engelsk, E og t regnes for, gætter Eve på, at E~A, det tredje hyppigste bogstav. Foreløbigt at gøre disse antagelser opnås følgende delvise dekrypterede meddelelse.

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReMWQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJGSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtVeZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMthaPPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPPthMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt

ved hjælp af disse indledende gæt kan Eve få øje på mønstre, der bekræfter hendes valg, såsom “det”. Desuden antyder andre mønstre yderligere gæt. “Rtate “kan være” state”, hvilket ville betyde R~s. tilsvarende” atthattmse “kunne gættes som” atthattime”, hvilket giver M~i og å~m. desuden kan” heVe “være” her”, hvilket giver V~r. Udfyldning af disse gæt, Eve får:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGaseiWQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJGSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtremitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQithaPPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPPthiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit

til gengæld antyder disse gæt endnu andre (for eksempel “remarA” kunne være “bemærkning”, hvilket antyder A~k) og så videre, og det er relativt ligetil at udlede resten af bogstaverne og til sidst give almindelig tekst.

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscaseinwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsofcourseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextremityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywithalltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingallthingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit

på dette tidspunkt ville det være en god ide for Eve at indsætte mellemrum og tegnsætning:

Hereupon Legrand arose, with a grave and stately air, and brought me the beetlefrom a glass case in which it was enclosed. It was a beautiful scarabaeus, and, atthat time, unknown to naturalists—of course a great prize in a scientific pointof view. There were two round black spots near one extremity of the back, and along one near the other. The scales were exceedingly hard and glossy, with all theappearance of burnished gold. The weight of the insect was very remarkable, and,taking all things into consideration, I could hardly blame Jupiter for his opinionrespecting it.

i dette eksempel fra Gold-Bug var Evas gæt alle korrekte. Dette ville ikke altid være tilfældet, imidlertid; variationen i statistikker for individuelle klartekster kan betyde, at indledende gæt er forkerte. Det kan være nødvendigt at backtrack forkerte gæt eller at analysere de tilgængelige statistikker i meget mere dybde end de noget forenklede begrundelser i ovenstående eksempel.

det er også muligt, at klarteksten ikke udviser den forventede fordeling af bogstavfrekvenser. Kortere meddelelser vil sandsynligvis vise mere variation. Det er også muligt at konstruere kunstigt skæve tekster. For eksempel er der skrevet hele romaner, der udelader bogstavet “e” helt — en form for litteratur kendt som et lipogram.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.