Frekvenssianalyysi

yksinkertaisessa korvaussalakirjoituksessa selkotekstin jokainen kirjain korvataan toisella, ja mikä tahansa selkotekstin kirjain muutetaan aina samaksi kirjaimeksi salatekstissä. Esimerkiksi, jos kaikki e-kirjaimen esiintymät muuttuvat X-kirjaimeksi, salakirjoitussanoma, joka sisältää lukuisia X-kirjaimen esiintymiä, viittaisi salakirjoituslaitteelle, että X edustaa e: tä.

taajuusanalyysin peruskäyttö on laskea ensin salakirjainten esiintymistiheys ja liittää sitten arvattuja selkokirjaimia niihin. Enemmän Xs salatekstissä kuin mikään muu viittaa siihen, että X vastaa E: tä selkotekstissä, mutta tämä ei ole varmaa; t ja a ovat myös hyvin yleisiä englannin kielessä, joten X saattaa olla myös jompikumpi niistä. Se ei todennäköisesti ole pelkkä teksti z tai q, jotka ovat harvinaisempia. Siksi salakirjoitustutkijan on ehkä kokeiltava useita yhdistelyjä salatekstin ja selkotekstin kirjainten välillä.

voidaan ajatella monimutkaisempaa tilastojen käyttöä, kuten esimerkiksi kirjainparien (bigramit), kolmosten (trigrammit) laskemista ja niin edelleen. Tämä tehdään lisätietojen antamiseksi kryptoanalyytikolle, esimerkiksi Q ja U esiintyvät englannin kielessä lähes aina samassa järjestyksessä, vaikka Q itsessään on harvinainen.

an exampleEdit

Oletetaan, että Eve on siepannut alla olevan Kryptogrammin, ja sen tiedetään olevan salattu yksinkertaisella korvaussalauksella seuraavasti:

LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIMWQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJGSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXVIZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLEPPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPPXLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX

tässä esimerkissä käytetään isoja kirjaimia merkitsemään salatekstiä, pieniä kirjaimia käytetään ilmaisemaan selkotekstiä (tai arvauksia sellaisessa) Ja x~T käytetään ilmaisemaan arvausta, että salatekstin kirjain X edustaa tavallista T-kirjainta.

Eve saattoi käyttää frekvenssianalyysiä auttaakseen viestin ratkaisemisessa seuraavasti: Kryptogrammin kirjainten laskeminen osoittaa, että I on yleisin yksittäinen kirjain, XL yleisin bigram ja XLI on yleisin trigrammi. e on yleisin kirjain englannin kielessä, th on yleisin bigram, ja on yleisin trigram. Tämä viittaa vahvasti siihen, että X~t, l~h ja I~e. Kryptogrammin toiseksi yleisin kirjain on E; koska englannin kielen ensimmäinen ja toiseksi yleisin kirjain e ja t lasketaan, Eeva arvelee, että e~a, kolmanneksi yleisin kirjain. Alustavasti tekemällä nämä oletukset saadaan seuraava osittainen salattu viesti.

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReMWQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJGSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtVeZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMthaPPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPPthMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt

näitä alkuarvioita käyttäen Eeva voi bongata kuvioita, jotka vahvistavat hänen valintojaan, kuten ”että”. Lisäksi muut kuviot viittaavat uusiin arvauksiin. ”Rtate ”voisi olla” state”, mikä tarkoittaisi r~s. vastaavasti” atthattMZe ”voitaisiin arvata” atthattime”, jolloin saadaan m~i ja Z~m. lisäksi” heVe ”voisi olla” here”, jolloin V~r. Täyttämällä nämä arvaukset, Eve saa:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGaseiWQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJGSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtremitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQithaPPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPPthiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit

vuorostaan nämä arvaukset viittaavat vielä toisiin (esimerkiksi ” remarA ”voisi olla” huomautus”, mikä merkitsee~k) ja niin edelleen, ja on suhteellisen suoraviivaista päätellä loput kirjaimet, jolloin saadaan lopulta selkoteksti.

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscaseinwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsofcourseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextremityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywithalltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingallthingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit

tässä vaiheessa Eevan olisi hyvä lisätä välilyöntejä ja välimerkkejä:

Hereupon Legrand arose, with a grave and stately air, and brought me the beetlefrom a glass case in which it was enclosed. It was a beautiful scarabaeus, and, atthat time, unknown to naturalists—of course a great prize in a scientific pointof view. There were two round black spots near one extremity of the back, and along one near the other. The scales were exceedingly hard and glossy, with all theappearance of burnished gold. The weight of the insect was very remarkable, and,taking all things into consideration, I could hardly blame Jupiter for his opinionrespecting it.

tässä esimerkissä Kultahupusta Eevan arvaukset osuivat kaikki oikeaan. Näin ei kuitenkaan aina olisi; tilastojen vaihtelu yksittäisten selkotekstien osalta voi tarkoittaa, että alkuarviot ovat virheellisiä. Voi olla tarpeen palata virheellisiin arvauksiin tai analysoida saatavilla olevia tilastoja paljon syvällisemmin kuin edellä mainitussa esimerkissä esitetyt hieman yksinkertaistetut perustelut.

on myös mahdollista, että selkotekstissä ei ole odotettavissa kirjetaajuuksien jakautumista. Lyhyemmissä viesteissä on todennäköisesti enemmän vaihtelua. On myös mahdollista rakentaa keinotekoisesti vääristyneitä tekstejä. On esimerkiksi kirjoitettu kokonaisia romaaneja, joissa e — kirjain jätetään kokonaan pois-kirjallisuudenlaji tunnetaan lipogrammina.

Vastaa

Sähköpostiosoitettasi ei julkaista.