Brechen von monoalphabetischen Substitutions-Chiffren

Nachdem man die Art der Chiffre bestimmt hat und sicher ist, dass es sich um eine monoalphabetischen Substitutions-Chiffre handelt, empfiehlt sich folgendes, weiteres Vorgehen.

Code/Chiffre anhand des Aussehen erkennen

Mancher Chiffre sieht man schon am Erscheinungsbild an, welche sie ist. Zum Beispiel wenn eine Geheimschrift seltsame Symbole oder Farben benutzt. Bei der Identifizierung der Geheimschrift hilft dann eine Übersicht von Geheimschriftzeichen. Doch meistens wird der Geheimtext mit normalen Buchstaben und Ziffern dargestellt sein. Und wenn die Geheimschrift nicht bereits nach dem ersten Schritt entziffert ist, etwa weil eine weitere Verschlüsselung des Geheimtextes vorliegt (Überschlüsselung gennant), empfiehlt sich die Überführung in normale Buchstaben und Ziffern. Ganz einfach, weil man in den vertrauten Zeichen sehr viel schneller Muster erkennen kann als in ungewohnten Symbolen. Zudem kann man darauf einfacher Software-Werkzeuge anwenden und sich mit Kollegen austauschen, sei es über e-mail oder auch sprachlich ("das D" statt "dieser komischer Kringel mit dem Auswuchs da oben rechts").

Eventuell verrät sich die Chiffre auch durch die verwendete Zeichen. Kommen nur "." und "-" vor, spricht das für Morse. Kommen nur Nullen und Einsen vor, spricht das für einen binären Code. Oder es kommen ausschließlich Ziffern vor (z. B. Straddling Checkerboard). Oder nur Ziffern im Breich 1 bis 5, das spräche für die Verwendung eines Polybios-Quadrats.

Der Abaddon Code verrät sich z. B. dadurch, dass er "Wörter" mit 3 "Buchstaben", bestehend aus den seltsam aussehenden Zeichen "þ", "µ", und "¥". Dies erkannt, ist er schnell geknackt, denn es gibt eine eindeutige Zuordnung von den Wörtern zu Klartext-Buchtaben. Der Abaddon Code ist auch ein gutes Beispiel dafür, dass nicht immer ein Klartextbuchstabe durch genau einen Geheimtextbuchstaben ersetzt werden muss - beim Abaddon Code wird nämlich aus eins drei. Zum Entziffern müssen dementsprechend 3 Geheim-Zeichen durch ein Klartext-Zeichen ersetzt werden.

Brute-Force-Check der einfachen Transpositions-Chiffren

Die einfachen Transpositions-Chiffren sind die, die sich durch Brute-Force leicht überprüfen lassen. Diese sollten ausprobiert werden. Vielleicht ist die Chiffre damit schon geknackt und weitere Arbeit kann entfallen.

Cäsar und ROT-X knacken

Eine Buchstabenverschiebung bei der Cäsar oder ROT-X-Chiffre lässt sich leicht herausfinden, indem man einfach die 25 Möglichkeiten dafür durchgeht.

Chiffrat: QEIMDQUZYMXQUZWXQUZQEEGQEEQEYMQPOTQZPMETMFFQVQPQDYMZZXUQNPQDEUQZGDMZEMT Mögliche Verschiebungen: 01: RFJNERVAZNYRVAXYRVARFFHRFFRFZNRQPURAQNFUNGGRWRQREZNAAYVROQREFVRAHENAFNU 02: SGKOFSWBAOZSWBYZSWBSGGISGGSGAOSRQVSBROGVOHHSXSRSFAOBBZWSPRSFGWSBIFOBGOV 03: THLPGTXCBPATXCZATXCTHHJTHHTHBPTSRWTCSPHWPIITYTSTGBPCCAXTQSTGHXTCJGPCHPW 04: UIMQHUYDCQBUYDABUYDUIIKUIIUICQUTSXUDTQIXQJJUZUTUHCQDDBYURTUHIYUDKHQDIQX 05: VJNRIVZEDRCVZEBCVZEVJJLVJJVJDRVUTYVEURJYRKKVAVUVIDREECZVSUVIJZVELIREJRY 06: WKOSJWAFESDWAFCDWAFWKKMWKKWKESWVUZWFVSKZSLLWBWVWJESFFDAWTVWJKAWFMJSFKSZ 07: XLPTKXBGFTEXBGDEXBGXLLNXLLXLFTXWVAXGWTLATMMXCXWXKFTGGEBXUWXKLBXGNKTGLTA 08: YMQULYCHGUFYCHEFYCHYMMOYMMYMGUYXWBYHXUMBUNNYDYXYLGUHHFCYVXYLMCYHOLUHMUB 09: ZNRVMZDIHVGZDIFGZDIZNNPZNNZNHVZYXCZIYVNCVOOZEZYZMHVIIGDZWYZMNDZIPMVINVC 10: AOSWNAEJIWHAEJGHAEJAOOQAOOAOIWAZYDAJZWODWPPAFAZANIWJJHEAXZANOEAJQNWJOWD 11: BPTXOBFKJXIBFKHIBFKBPPRBPPBPJXBAZEBKAXPEXQQBGBABOJXKKIFBYABOPFBKROXKPXE 12: CQUYPCGLKYJCGLIJCGLCQQSCQQCQKYCBAFCLBYQFYRRCHCBCPKYLLJGCZBCPQGCLSPYLQYF 13: DRVZQDHMLZKDHMJKDHMDRRTDRRDRLZDCBGDMCZRGZSSDIDCDQLZMMKHDACDQRHDMTQZMRZG 14: ESWAREINMALEINKLEINESSUESSESMAEDCHENDASHATTEJEDERMANNLIEBDERSIENURANSAH 15: FTXBSFJONBMFJOLMFJOFTTVFTTFTNBFEDIFOEBTIBUUFKFEFSNBOOMJFCEFSTJFOVSBOTBI 16: GUYCTGKPOCNGKPMNGKPGUUWGUUGUOCGFEJGPFCUJCVVGLGFGTOCPPNKGDFGTUKGPWTCPUCJ 17: HVZDUHLQPDOHLQNOHLQHVVXHVVHVPDHGFKHQGDVKDWWHMHGHUPDQQOLHEGHUVLHQXUDQVDK 18: IWAEVIMRQEPIMROPIMRIWWYIWWIWQEIHGLIRHEWLEXXINIHIVQERRPMIFHIVWMIRYVERWEL 19: JXBFWJNSRFQJNSPQJNSJXXZJXXJXRFJIHMJSIFXMFYYJOJIJWRFSSQNJGIJWXNJSZWFSXFM 20: KYCGXKOTSGRKOTQRKOTKYYAKYYKYSGKJINKTJGYNGZZKPKJKXSGTTROKHJKXYOKTAXGTYGN 21: LZDHYLPUTHSLPURSLPULZZBLZZLZTHLKJOLUKHZOHAALQLKLYTHUUSPLIKLYZPLUBYHUZHO 22: MAEIZMQVUITMQVSTMQVMAACMAAMAUIMLKPMVLIAPIBBMRMLMZUIVVTQMJLMZAQMVCZIVAIP 23: NBFJANRWVJUNRWTUNRWNBBDNBBNBVJNMLQNWMJBQJCCNSNMNAVJWWURNKMNABRNWDAJWBJQ 24: OCGKBOSXWKVOSXUVOSXOCCEOCCOCWKONMROXNKCRKDDOTONOBWKXXVSOLNOBCSOXEBKXCKR 25: PDHLCPTYXLWPTYVWPTYPDDFPDDPDXLPONSPYOLDSLEEPUPOPCXLYYWTPMOPCDTPYFCLYDLS Schnell wird ersichtlich, dass hier der Schlüssel 14 den Klartext ergibt.

Atbash knacken

Atbash hat einen festen Schlüssel und es gibt nur eine Möglichkeit, die man ebenfalls probieren sollte. Chiffrat: VHDZIVRMNZOVRMPOVRMVHHFVHHVHNZVWXSVMWZHSZGGVQVWVINZMMORVYWVIHRVMFIZMHZS Klartext: ESWAREINMALEINKLEINESSUESSESMAEDCHENDASHATTEJEDERMANNLIEBDERSIENURANSAH

Andere monoalphabetische Substitutions-Chiffren knacken

Handelt sich bei der Chiffre um eine Verschlüsselung, bei der ein Buchstabe immer durch den selben, anderen Buchstaben (oder Symbol) ersetzt wird, dann kann man sich zunutze machen, dass die Häufigkeiten der einzelnen Buchstaben in einer natürliche Sprache nicht gleich verteilt sind, sondern bestimmte Buchstaben häufiger vorkommen als andere, z. B. das 'E' in deutsch und englisch. Man muss beachten, dass eventuell Homophone oder Blender zum Einsatz kommen, die die Entzifferung erschweren. Wir wollen diese Erschwernisse aber zunächst einmal außer Acht lassen.

Durch das Zählen der Buchstaben von Texten z. B. der deutschen Sprache erhält man eine statistische Häufigkeitsverteilung, die ein durchschnittlicher Klartext aufweisen sollte. Diese kann mit der Häufigkeitsverteilung des Geheimtextes verglichen werden. So kann man z. B. herausfinden, in welcher Sprache der Klartext abgefasst ist, denn die Verteilungen unterscheiden sich je nach Sprache. Auf der anderen Seite: weiß man, dass der Klartext in einer bestimmten Fachsprache abgefasst ist, z. B. Fachbereich Informatik, dann lohnt es sich evtl. IT-Fachliteratur als Grundlage für die Häufigkeitsverteilung zu benutzen, um noch genauere Prozentzahlen für die einzelnen Buchstaben für dieses Fachgebiet zu erhalten.

ABCDEFGHIJKLMNOPQRSTUVWXYZ
Normalverteilung deutsch


Nehmen wir an, das häufigste Zeichen ist das X mit 17,38%, danach folgend das Y mit 10,02% und das Z mit 7,85%. Ein Blick in eine entsprechende Tabelle mit der Häufigkeitsverteilung ergibt, dass im Deutschen die häufigsten Buchstaben eine ganz ähnliche Häufigkeit aufweisen: E mit 17,41%, N mit 9,78% und S mit 7,89%. Dann kann man davon ausgehen, dass das chiffrierte X für ein Klartext-E steht, das Y für ein N und das Z für ein S. Dann ersetzt man entsprechend alle X durch E etc. und führt das für weitere, von der Verteilung eindeutige Buchstaben fort. Damit hat man den Großteil des Klartextes bereits wiederhergestellt. Danach beginnt man zu kombinieren und kurze oder wahrscheinliche Wörter zu erraten - das fällt besonders einfach, wenn Leer- oder Satzzeichen noch vorhanden sind. So erkannte und hinzugewonnene Klartextbuchstabe kann man wieder im Chiffrat ersetzen. Das führt man fort, bis der Klartext komplett wiederhergestellt ist. Ggf. helfen Tabellen über die häufigsten Anfangs- und Endbuchstaben oder Bi- (er, en, ch...) oder Trigramme (ich, ein, und...) oder Doppelbuchstaben (ss, nn, ll...).

Bei langen Texte sollten die Häufigkeitsverteilungen ziemlich genau auf die statistischen Werte kommen. Kürzere Texte reichen evtl. nicht für genaue Prozentzahlen, dann ist die Reihenfolge der Häufigkeit evtl. nicht die aus der statistischen Tabelle - evtl. kommt das S im anvisierten Klartext doch häufiger als das N vor. Dann darf man natürlich nicht stur nach Rezept vorgehen, sondern muss auch mal eine andere Reihenfolge probieren. Mit der entsprechenden Geduld ergibt sich dann auch ein lesabrer Klartext.

Beispiel für eine monoalphabetische Subsitution mit Leer- und Satzzeichen

NP GKR NYCBKO NYC AONYCNP PSNPPNP BKNTVXNC, TKP XKQQN ZNTNRBKCC OYNU, TNR PYN CSR KCPKX, KB KOONROYNUPQNC KUNR YXRN WRDPPBSQQNR, TYN GSPPQN WKR CYVXQ, GKP PYN KOONP TNB AYCTN WNUNC PDOOQN. NYCBKO PVXNCAQN PYN YXB NYC AKNLLVXNC FDC RDQNB PKBQ, SCT GNYO YXB TKP PD GDXO PQKCT, SCT NP CYVXQP KCTNRP BNXR QRKWNC GDOOQN, XYNPP NP CSR TKP RDQAKNLLVXNC. NYCNP QKWNP PLRKVX PNYCN BSQQNR JS YXB: "ADBB, RDQAKNLLVXNC, TK XKPQ TS NYC PQSNVA ASVXNC SCT NYCN MOKPVXN GNYC, URYCW TKP TNR WRDPPBSQQNR XYCKSP; PYN YPQ ARKCA SCT PVXGKVX SCT GYRT PYVX TKRKC OKUNC. BKVX TYVX KSM, UNFDR NP XNYPP GYRT, SCT GNCC TS XYCKSPADBBPQ, PD WNX XSNUPVX PYQQPKB SCT OKSM CYVXQ FDB GNWN KU, PDCPQ MKNOOPQ TS SCT JNRURYVXPQ TKP WOKP, SCT TYN WRDPPBSQQNR XKQ CYVXQP. SCT GNCC TS YC YXRN PQSUN ADBBPQ, PD FNRWYPP CYVXQ WSQNC BDRWNC JS PKWNC SCT WSVA CYVXQ NRPQ YC KOONC NVANC XNRSB!
ABCDEFGHIJKLMNOPQRSTUVWXYZ
Verteilung für Text aus Eingabefeld
ABCDEFGHIJKLMNOPQRSTUVWXYZ
Zum Vergleich: Normalverteilung deutsch
Es sticht der Buchstabe N mit 13,46% als häufigster Buchstabe heraus. Dies ist zwar etwas von den 17,41% im Deutschen entfernt, aber die beste Option zu beginnen. Wir ersetzen also das N durch ein e ABCDEFGHIJKLMNOPQRSTUVWXYZ -------------e------------ eP GKR eYCBKO eYC AOeYCeP PSePPeP BKeTVXeC, TKP XKQQe ZeTeRBKCC OYeU, TeR PYe CSR KCPKX, KB KOOeROYeUPQeC KUeR YXRe WRDPPBSQQeR, TYe GSPPQe WKR CYVXQ, GKP PYe KOOeP TeB AYCTe WeUeC PDOOQe. eYCBKO PVXeCAQe PYe YXB eYC AKeLLVXeC FDC RDQeB PKBQ, SCT GeYO YXB TKP PD GDXO PQKCT, SCT eP CYVXQP KCTeRP BeXR QRKWeC GDOOQe, XYePP eP CSR TKP RDQAKeLLVXeC. eYCeP QKWeP PLRKVX PeYCe BSQQeR JS YXB: "ADBB, RDQAKeLLVXeC, TK XKPQ TS eYC PQSeVA ASVXeC SCT eYCe MOKPVXe GeYC, URYCW TKP TeR WRDPPBSQQeR XYCKSP; PYe YPQ ARKCA SCT PVXGKVX SCT GYRT PYVX TKRKC OKUeC. BKVX TYVX KSM, UeFDR eP XeYPP GYRT, SCT GeCC TS XYCKSPADBBPQ, PD WeX XSeUPVX PYQQPKB SCT OKSM CYVXQ FDB GeWe KU, PDCPQ MKeOOPQ TS SCT JeRURYVXPQ TKP WOKP, SCT TYe WRDPPBSQQeR XKQ CYVXQP. SCT GeCC TS YC YXRe PQSUe ADBBPQ, PD FeRWYPP CYVXQ WSQeC BDRWeC JS PKWeC SCT WSVA CYVXQ eRPQ YC KOOeC eVAeC XeRSB!

Seite 2 >