Frequenzanalyse

Bei einer einfachen Ersetzungschiffre wird jeder Buchstabe des Klartexts durch einen anderen ersetzt, und jeder bestimmte Buchstabe im Klartext wird immer in denselben Buchstaben im Chiffretext umgewandelt. Wenn zum Beispiel alle Vorkommen des Buchstabens e in den Buchstaben X umgewandelt werden, würde eine Chiffretextnachricht, die zahlreiche Instanzen des Buchstabens X enthält, einem Kryptanalytiker vorschlagen, dass X e darstellt.

Die grundlegende Verwendung der Frequenzanalyse besteht darin, zuerst die Häufigkeit von Chiffretextbuchstaben zu zählen und ihnen dann vermutete Klartextbuchstaben zuzuordnen. Mehr Xs im Chiffretext als alles andere deutet darauf hin, dass X im Klartext e entspricht, aber das ist nicht sicher; t und a sind auch im Englischen sehr verbreitet, also könnte X auch einer von ihnen sein. Es ist unwahrscheinlich, dass es sich um einen Klartext z oder q handelt, die seltener vorkommen. Daher muss der Kryptoanalytiker möglicherweise mehrere Kombinationen von Zuordnungen zwischen Chiffretext- und Klartextbuchstaben ausprobieren.

Es kann eine komplexere Verwendung von Statistiken konzipiert werden, z. B. die Anzahl der Buchstabenpaare (Bigramme), Drillinge (Trigramme) usw. Dies geschieht, um dem Kryptoanalytiker mehr Informationen zur Verfügung zu stellen, zum Beispiel treten Q und U fast immer zusammen in dieser Reihenfolge auf Englisch auf, obwohl Q selbst selten ist.

Ein Beispielbearbeiten

Angenommen, Eve hat das folgende Kryptogramm abgefangen, und es ist bekannt, dass es mit einer einfachen Ersetzungschiffre wie folgt verschlüsselt wird:

LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIMWQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJGSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXVIZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLEPPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPPXLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX

In diesem Beispiel werden Großbuchstaben verwendet, um Chiffretext zu bezeichnen, Kleinbuchstaben werden verwendet, um Klartext zu bezeichnen (oder solche zu erraten), und X ~t wird verwendet, um eine Vermutung auszudrücken, dass der Chiffretextbuchstabe X den Klartextbuchstaben t darstellt.

Eve könnte die Frequenzanalyse verwenden, um die Nachricht entlang der folgenden Zeilen zu lösen: Die Anzahl der Buchstaben im Kryptogramm zeigt, dass I der häufigste Einzelbuchstabe, XL das häufigste Bigramm und XLI das häufigste Trigramm ist. e ist der häufigste Buchstabe in der englischen Sprache, th ist das häufigste Bigramm und das ist das häufigste Trigramm. Dies deutet stark darauf hin, dass X ~ t, L ~ h und I~e. Der zweithäufigste Buchstabe im Kryptogramm ist E; da die ersten und zweithäufigsten Buchstaben in der englischen Sprache, e und t, berücksichtigt werden, vermutet Eve, dass E ~ a der dritthäufigste Buchstabe ist. Wenn diese Annahmen vorläufig getroffen werden, wird die folgende teilweise entschlüsselte Nachricht erhalten.

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReMWQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJGSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtVeZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMthaPPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPPthMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt

Mit diesen anfänglichen Vermutungen kann Eva Muster erkennen, die ihre Entscheidungen bestätigen, wie „das“. Darüber hinaus deuten andere Muster auf weitere Vermutungen hin. Ähnlich könnte „atthattMZe“ als „atthattime“ erraten werden, was M ~ i und Z ~ m ergibt. Außerdem könnte „heVe“ „hier“ sein und V ~ r . Ausfüllen dieser Vermutungen, Eve bekommt:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGaseiWQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJGSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtremitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQithaPPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPPthiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit

Diese Vermutungen deuten wiederum auf noch andere hin (zum Beispiel könnte „remarA“ „Bemerkung“ sein, was A ~ k impliziert) und so weiter, und es ist relativ einfach, den Rest der Buchstaben abzuleiten, was schließlich den Klartext ergibt.

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscaseinwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsofcourseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextremityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywithalltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingallthingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit

An dieser Stelle wäre es eine gute Idee für Eve, Leerzeichen und Interpunktion einzufügen:

Hereupon Legrand arose, with a grave and stately air, and brought me the beetlefrom a glass case in which it was enclosed. It was a beautiful scarabaeus, and, atthat time, unknown to naturalists—of course a great prize in a scientific pointof view. There were two round black spots near one extremity of the back, and along one near the other. The scales were exceedingly hard and glossy, with all theappearance of burnished gold. The weight of the insect was very remarkable, and,taking all things into consideration, I could hardly blame Jupiter for his opinionrespecting it.

In diesem Beispiel aus dem Gold-Bug waren Evas Vermutungen alle richtig. Dies wäre jedoch nicht immer der Fall; die Variation der Statistiken für einzelne Klartexte kann bedeuten, dass anfängliche Vermutungen falsch sind. Es kann notwendig sein, falsche Vermutungen zurückzuverfolgen oder die verfügbaren Statistiken viel eingehender zu analysieren als die im obigen Beispiel angegebenen etwas vereinfachten Begründungen.

Es ist auch möglich, dass der Klartext nicht die erwartete Verteilung der Buchstabenfrequenzen aufweist. Kürzere Nachrichten zeigen wahrscheinlich mehr Variationen. Es ist auch möglich, künstlich verzerrte Texte zu konstruieren. Zum Beispiel wurden ganze Romane geschrieben, die den Buchstaben „e“ ganz weglassen — eine Form der Literatur, die als Lipogramm bekannt ist.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.