Frekvensanalys

i en enkel substitutionskryptering ersätts varje bokstav i klartext med en annan, och varje särskild bokstav i klartext kommer alltid att omvandlas till samma bokstav i chiffertexten. Till exempel, om alla förekomster av bokstaven e förvandlas till bokstaven X, skulle ett chiffertextmeddelande som innehåller många instanser av bokstaven X föreslå en kryptanalytiker att X representerar e.

den grundläggande användningen av frekvensanalys är att först räkna frekvensen av chiffertextbokstäver och sedan associera gissade klartextbokstäver med dem. Mer Xs i chiffertexten än något annat tyder på att X motsvarar e i klartext, men detta är inte säkert; t och a är också mycket vanliga på engelska, så X kan vara någon av dem också. Det är osannolikt att det är en klartext z eller q som är mindre vanliga. Således kan cryptanalyst behöva prova flera kombinationer av mappningar mellan ciphertext och klartext bokstäver.

mer komplex användning av statistik kan uppfattas, såsom att överväga räkningar av par av bokstäver (bigram), tripletter (trigram) och så vidare. Detta görs för att ge mer information till cryptanalyst, till exempel, Q och U förekommer nästan alltid tillsammans i den ordningen på engelska, även om Q själv är sällsynt.

ett exempelredigera

Antag att Eve har avlyssnat kryptogrammet nedan, och det är känt att det krypteras med en enkel substitutionskryptering enligt följande:

LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIMWQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJGSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXVIZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLEPPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPPXLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX

i det här exemplet används stora bokstäver för att beteckna chiffertext, små bokstäver används för att beteckna klartext (eller gissningar vid sådana) och X~t används för att uttrycka en gissning om att chiffertext bokstaven X representerar klartext bokstaven t.

Eve kan använda frekvensanalys för att lösa meddelandet längs följande rader: räkningar av bokstäverna i kryptogrammet visar att jag är den vanligaste enstaka bokstaven, XL vanligaste bigram och XLI är den vanligaste trigram. e är den vanligaste bokstaven på engelska, th är den vanligaste bigram, och är den vanligaste trigram. Detta tyder starkt på att X~t, L~h och I~e. den näst vanligaste bokstaven i kryptogrammet är E; sedan de första och näst vanligaste bokstäverna på engelska, E och t redovisas, gissar Eve att E~a, den tredje vanligaste bokstaven. Preliminärt göra dessa antaganden erhålls följande partiella dekrypterade meddelande.

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReMWQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJGSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtVeZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMthaPPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPPthMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt

med hjälp av dessa initiala gissningar kan Eva upptäcka mönster som bekräftar hennes val, till exempel ”det”. Dessutom föreslår andra mönster ytterligare gissningar. ”Rtate ”kan vara” state”, vilket skulle innebära R~s. på samma sätt kan” atthattMZe ”gissas som” atthattime”, vilket ger M~I och Z~m. Dessutom kan” heVe ”vara” här”, vilket ger V~r. Fylla i dessa gissningar, Eva får:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGaseiWQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJGSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtremitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQithaPPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPPthiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit

i sin tur föreslår dessa gissningar fortfarande andra (till exempel ”remarA” kan vara ”anmärkning”, vilket innebär a~k) och så vidare, och det är relativt enkelt att härleda resten av bokstäverna, vilket så småningom ger klartext.

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscaseinwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsofcourseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextremityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywithalltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingallthingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit

vid denna tidpunkt skulle det vara bra för Eve att infoga mellanslag och skiljetecken:

Hereupon Legrand arose, with a grave and stately air, and brought me the beetlefrom a glass case in which it was enclosed. It was a beautiful scarabaeus, and, atthat time, unknown to naturalists—of course a great prize in a scientific pointof view. There were two round black spots near one extremity of the back, and along one near the other. The scales were exceedingly hard and glossy, with all theappearance of burnished gold. The weight of the insect was very remarkable, and,taking all things into consideration, I could hardly blame Jupiter for his opinionrespecting it.

i detta exempel från Gold-Bug var Evas gissningar alla korrekta. Detta skulle dock inte alltid vara fallet; variationen i statistiken för enskilda klartexter kan innebära att initiala gissningar är felaktiga. Det kan vara nödvändigt att backtracka felaktiga gissningar eller att analysera tillgänglig statistik på mycket mer djup än de något förenklade motiveringarna i ovanstående exempel.

det är också möjligt att klartext inte uppvisar den förväntade fördelningen av bokstavsfrekvenser. Kortare meddelanden kommer sannolikt att visa mer variation. Det är också möjligt att konstruera artificiellt snedställda texter. Till exempel har hela romaner skrivits som utelämnar bokstaven ”e” helt och hållet — en form av litteratur som kallas ett lipogram.

Lämna ett svar

Din e-postadress kommer inte publiceras.