Frequentieanalyse

In een eenvoudige substitutiecode wordt elke letter van de platte tekst vervangen door een andere, en elke specifieke letter in de platte tekst zal altijd worden omgezet in dezelfde letter in de versleutelde tekst. Bijvoorbeeld, als alle gebeurtenissen van de letter e in de letter X veranderen, zou een versleuteltekstbericht dat talrijke exemplaren van de letter X Bevat, aan een cryptanalyst suggereren dat X e vertegenwoordigt.

het basisgebruik van frequentieanalyse is om eerst de frequentie van versleuteltekstletters te tellen en dan geraden gewone letters ermee te associëren. Meer Xs in de cijfertekst dan iets anders suggereert dat X overeenkomt met e in de gewone tekst, maar dit is niet zeker; t en a komen ook veel voor in het Engels, dus X kan ook een van beide zijn. Het is onwaarschijnlijk dat het een platte tekst z of q is die minder vaak voorkomt. Dus de cryptanalyst kan nodig zijn om verschillende combinaties van toewijzingen tussen versleutelde en platte tekst letters proberen.

complexer gebruik van statistieken kan worden opgevat, zoals het overwegen van tellingen van letterparen (bigrams), drieling (trigrammen), enzovoort. Dit wordt gedaan om meer informatie te verstrekken aan de cryptanalyst, bijvoorbeeld, Q en U komen bijna altijd samen in die volgorde in het Engels, hoewel Q zelf zeldzaam is.

Een exampleEdit

Stel Eva heeft onderschept het cryptogram hieronder, en het is bekend om te worden gecodeerd met behulp van een eenvoudige substitutie als volgt:

LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIMWQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJGSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXVIZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLEPPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPPXLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX

Voor dit voorbeeld, hoofdletters worden gebruikt om aan te geven cijfertekst, kleine letters worden gebruikt om aan te geven leesbare tekst (of gissingen op dergelijke), en X~t is gebruikt om een schatting die cijfertekst letter X staat voor de klare letter t.

Eve zou frequentieanalyse kunnen gebruiken om het bericht op te lossen volgens de volgende regels: tellingen van de letters in het cryptogram laten zien dat I de meest voorkomende enkele letter is, XL meest voorkomende bigram, en XLI is het meest voorkomende trigram. e is de meest voorkomende letter in de Engelse taal, th is de meest voorkomende bigram, en de is de meest voorkomende trigram. Dit suggereert sterk dat X~t, L~h en i~e. de tweede meest voorkomende letter in het cryptogram is E; omdat de eerste en tweede meest voorkomende letters in de Engelse taal, e en t zijn verantwoord, Eva raadt dat E~a, de derde meest voorkomende letter. Voorlopig het maken van deze aannames, de volgende gedeeltelijk gedecodeerde bericht wordt verkregen.

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReMWQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJGSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtVeZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMthaPPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPPthMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt

met behulp van deze eerste gissingen kan Eve patronen herkennen die haar keuzes bevestigen, zoals “dat”. Bovendien suggereren andere patronen verdere gissingen. “Rtate “zou” state “kunnen zijn, wat R~s zou betekenen. evenzo zou” atthattMZe “kunnen worden geraden als” atthatime”, wat M~i en Z~m oplevert. verder zou” heVe “” here ” kunnen zijn, wat V~r geeft. Het invullen van deze gissingen, Eve krijgt:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGaseiWQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJGSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtremitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQithaPPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPPthiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit

op hun beurt suggereren deze gissingen weer andere (bijvoorbeeld, “remarA” zou “opmerking” kunnen zijn, wat A~k impliceert) en ga zo maar door, en het is relatief eenvoudig om de rest van de letters af te leiden, wat uiteindelijk de gewone tekst oplevert.

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscaseinwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsofcourseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextremityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywithalltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingallthingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit

op dit punt zou het een goed idee zijn voor Eve om spaties en interpunctie in te voegen:

Hereupon Legrand arose, with a grave and stately air, and brought me the beetlefrom a glass case in which it was enclosed. It was a beautiful scarabaeus, and, atthat time, unknown to naturalists—of course a great prize in a scientific pointof view. There were two round black spots near one extremity of the back, and along one near the other. The scales were exceedingly hard and glossy, with all theappearance of burnished gold. The weight of the insect was very remarkable, and,taking all things into consideration, I could hardly blame Jupiter for his opinionrespecting it.

in dit voorbeeld van de Gold-Bug, Eve ‘ s gissingen waren allemaal correct. Dit zou echter niet altijd het geval zijn.; de variatie in statistieken voor individuele platte tekst kan betekenen dat de eerste gissingen onjuist zijn. Het kan nodig zijn om onjuiste gissingen terug te trekken of de beschikbare statistieken veel grondiger te analyseren dan de enigszins vereenvoudigde rechtvaardigingen die in bovenstaand voorbeeld worden gegeven.

het is ook mogelijk dat de gewone tekst niet de verwachte verdeling van de letterfrequenties vertoont. Kortere berichten laten waarschijnlijk meer variatie zien. Het is ook mogelijk om kunstmatig scheve teksten te construeren. Er zijn bijvoorbeeld hele romans geschreven die de letter “e” helemaal weglaten — een vorm van literatuur die bekend staat als een lipogram.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.