Frekvenční analýza

V jednoduché substituční šifry, každé písmeno v textu je nahrazeno jiným, a nějaké konkrétní písmeno v textu bude vždy být transformovány do stejné písmeno v ciphertext. Například, pokud všechny výskyty písmene e zase do písmene X, ciphertext zprávu obsahující četné případy písmeno X by navrhnout, aby dešifrování, že X představuje e.

základní použití frekvenční analýzy je nejprve spočítat frekvenci ciphertext dopisy a pak spojit hádal textu písmena s nimi. Více Xs v ciphertext, než cokoliv jiného naznačuje, že X odpovídá e v otevřeném textu, ale to není jisté; t a jsou také velmi časté v angličtině, takže X může být buď z nich také. Je nepravděpodobné, že by to byl prostý text z nebo q, které jsou méně časté. Tedy dešifrování může být nutné vyzkoušet několik kombinací mapování mezi ciphertext a plaintext dopisy.

složitější využití statistik může být koncipován, jako je s ohledem na počty párů písmen (bigrams), trojčata (trigrams), a tak dále. To se provádí, aby poskytla více informací k dešifrování, například, Q a U téměř vždy vyskytují společně v tom pořadí, v angličtině, i když Otázka sama o sobě je vzácné.

exampleEdit

Předpokládejme, že Eva má zachytil kryptogram níže, a je známo, že být zašifrován pomocí jednoduché substituční šifry takto:

LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIMWQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJGSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXVIZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLEPPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPPXLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX

Pro tento příklad, velká písmena se používají k označení ciphertext, malá písmena se používají k označení prostého textu (nebo pokusy), X~t se používá k vyjádření odhadnout, že šifrový písmeno X představuje holý písmeno t.

Eva by se použít frekvenční analýzu, aby pomohla řešit zprávu spolu tyto řádky: počty písmen v kryptogramu ukázat, že jsem je nejčastější jeden dopis, XL nejčastější bigram, a XLI je nejčastější trigram. e je nejběžnější písmeno v anglickém jazyce, th je nejběžnější bigram, a je nejběžnější trigram. To silně naznačuje, že X~t, L~h a i~e. druhým nejběžnějším písmenem v kryptogramu Je E; od první a druhé nejčastější dopisy v anglickém jazyce, e a t jsou tvořily, Eva uhodne, že E~a, třetí nejčastější dopis. Předběžně provedením těchto předpokladů se získá následující částečná dešifrovaná zpráva.

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReMWQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJGSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtVeZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMthaPPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPPthMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt

pomocí těchto počátečních odhadů může Eva rozpoznat vzory, které potvrzují její volby, například „to“. Další vzorce navíc naznačují další odhady. „Rtate“ může být „stát“, což by znamenalo R~s. podobně „atthattMZe“ lze odhadnout jako „atthattime“, čímž se získá M~i A Z~m. Dále „heVe“ může být „zde“, což dává V~r. Vyplňování těchto pokusů, Eve dostane:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGaseiWQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJGSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtremitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQithaPPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPPthiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit

Na druhé straně, tyto odhady naznačují, ještě jiní (například, „remarA“ by mohl být „poznámka“, což znamená,~k), a tak dále, a to je poměrně snadné odvodit zbytek písmen, nakonec získá otevřený text.

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscaseinwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsofcourseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextremityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywithalltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingallthingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit

V tomto bodě, to by bylo dobrý nápad, aby Eva vložit mezery a interpunkce:

Hereupon Legrand arose, with a grave and stately air, and brought me the beetlefrom a glass case in which it was enclosed. It was a beautiful scarabaeus, and, atthat time, unknown to naturalists—of course a great prize in a scientific pointof view. There were two round black spots near one extremity of the back, and along one near the other. The scales were exceedingly hard and glossy, with all theappearance of burnished gold. The weight of the insect was very remarkable, and,taking all things into consideration, I could hardly blame Jupiter for his opinionrespecting it.

V tomto příkladu z Gold-Bug, Eva odhady byly správné. To by nebylo vždy případ, nicméně; rozdíly ve statistikách pro jednotlivé prostétexty mohou znamenat, že počáteční odhady jsou nesprávné. Může být nutné ustoupit od nesprávných odhadů nebo analyzovat dostupné statistiky mnohem hlouběji než poněkud zjednodušená zdůvodnění uvedená ve výše uvedeném příkladu.

je také možné, že prostý text nevykazuje očekávané rozložení frekvencí písmen. Kratší zprávy pravděpodobně projeví více variací. Je také možné konstruovat uměle zkosené texty. Například byly napsány celé romány, které úplně vynechávají písmeno „e“ – formu literatury známou jako lipogram.

exampleEdit

Napsat komentář Zrušit odpověď na komentář