Brechen von monoalphabetischen Substitutions-Chiffren
Nachdem man die Art der Chiffre bestimmt hat und sicher ist, dass es sich um eine monoalphabetischen Substitutions-Chiffre handelt, empfiehlt sich folgendes, weiteres Vorgehen.Code/Chiffre anhand des Aussehen erkennen
Mancher Chiffre sieht man schon am Erscheinungsbild an, welche sie ist. Zum Beispiel wenn eine Geheimschrift seltsame Symbole oder Farben benutzt. Bei der Identifizierung der Geheimschrift hilft dann eine Übersicht von Geheimschriftzeichen. Doch meistens wird der Geheimtext mit normalen Buchstaben und Ziffern dargestellt sein. Und wenn die Geheimschrift nicht bereits nach dem ersten Schritt entziffert ist, etwa weil eine weitere Verschlüsselung des Geheimtextes vorliegt (Überschlüsselung gennant), empfiehlt sich die Überführung in normale Buchstaben und Ziffern. Ganz einfach, weil man in den vertrauten Zeichen sehr viel schneller Muster erkennen kann als in ungewohnten Symbolen. Zudem kann man darauf einfacher Software-Werkzeuge anwenden und sich mit Kollegen austauschen, sei es über e-mail oder auch sprachlich ("das D" statt "dieser komischer Kringel mit dem Auswuchs da oben rechts").Eventuell verrät sich die Chiffre auch durch die verwendete Zeichen. Kommen nur "." und "-" vor, spricht das für Morse. Kommen nur Nullen und Einsen vor, spricht das für einen binären Code. Oder es kommen ausschließlich Ziffern vor (z. B. Straddling Checkerboard). Oder nur Ziffern im Breich 1 bis 5, das spräche für die Verwendung eines Polybios-Quadrats.
Der Abaddon Code verrät sich z. B. dadurch, dass er "Wörter" mit 3 "Buchstaben", bestehend aus den seltsam aussehenden Zeichen "þ", "µ", und "¥". Dies erkannt, ist er schnell geknackt, denn es gibt eine eindeutige Zuordnung von den Wörtern zu Klartext-Buchtaben. Der Abaddon Code ist auch ein gutes Beispiel dafür, dass nicht immer ein Klartextbuchstabe durch genau einen Geheimtextbuchstaben ersetzt werden muss - beim Abaddon Code wird nämlich aus eins drei. Zum Entziffern müssen dementsprechend 3 Geheim-Zeichen durch ein Klartext-Zeichen ersetzt werden.
Brute-Force-Check der einfachen Substitutions-Chiffren
Die einfachen Substitutions-Chiffren sind die, die sich durch Brute-Force leicht überprüfen lassen. Diese sollten ausprobiert werden. Vielleicht ist die Chiffre damit schon geknackt und weitere Arbeit kann entfallen.Cäsar und ROT-X knacken
Eine Buchstabenverschiebung bei der Cäsar oder ROT-X-Chiffre lässt sich leicht herausfinden, indem man einfach die 25 Möglichkeiten dafür durchgeht.Chiffrat:
QEIMD QUZYM XQUZW XQUZQ EEGQE EQEYM QPOTQ ZPMET MFFQV QPQDY MZZXU QNPQD EUQZG DMZEM T
Mögliche Verschiebungen:
01: RFJNE RVAZN YRVAX YRVAR FFHRF FRFZN RQPUR AQNFU NGGRW RQREZ NAAYV ROQRE FVRAH ENAFN U
02: SGKOF SWBAO ZSWBY ZSWBS GGISG GSGAO SRQVS BROGV OHHSX SRSFA OBBZW SPRSF GWSBI FOBGO V
03: THLPG TXCBP ATXCZ ATXCT HHJTH HTHBP TSRWT CSPHW PIITY TSTGB PCCAX TQSTG HXTCJ GPCHP W
04: UIMQH UYDCQ BUYDA BUYDU IIKUI IUICQ UTSXU DTQIX QJJUZ UTUHC QDDBY URTUH IYUDK HQDIQ X
05: VJNRI VZEDR CVZEB CVZEV JJLVJ JVJDR VUTYV EURJY RKKVA VUVID REECZ VSUVI JZVEL IREJR Y
06: WKOSJ WAFES DWAFC DWAFW KKMWK KWKES WVUZW FVSKZ SLLWB WVWJE SFFDA WTVWJ KAWFM JSFKS Z
07: XLPTK XBGFT EXBGD EXBGX LLNXL LXLFT XWVAX GWTLA TMMXC XWXKF TGGEB XUWXK LBXGN KTGLT A
08: YMQUL YCHGU FYCHE FYCHY MMOYM MYMGU YXWBY HXUMB UNNYD YXYLG UHHFC YVXYL MCYHO LUHMU B
09: ZNRVM ZDIHV GZDIF GZDIZ NNPZN NZNHV ZYXCZ IYVNC VOOZE ZYZMH VIIGD ZWYZM NDZIP MVINV C
10: AOSWN AEJIW HAEJG HAEJA OOQAO OAOIW AZYDA JZWOD WPPAF AZANI WJJHE AXZAN OEAJQ NWJOW D
11: BPTXO BFKJX IBFKH IBFKB PPRBP PBPJX BAZEB KAXPE XQQBG BABOJ XKKIF BYABO PFBKR OXKPX E
12: CQUYP CGLKY JCGLI JCGLC QQSCQ QCQKY CBAFC LBYQF YRRCH CBCPK YLLJG CZBCP QGCLS PYLQY F
13: DRVZQ DHMLZ KDHMJ KDHMD RRTDR RDRLZ DCBGD MCZRG ZSSDI DCDQL ZMMKH DACDQ RHDMT QZMRZ G
14: ES WAR EINMAL EIN KLEINES SUESSES MAEDCHEN DAS HATTE JEDERMANN LIEB DER SIE NUR ANSAH
15: FTXBS FJONB MFJOL MFJOF TTVFT TFTNB FEDIF OEBTI BUUFK FEFSN BOOMJ FCEFS TJFOV SBOTB I
16: GUYCT GKPOC NGKPM NGKPG UUWGU UGUOC GFEJG PFCUJ CVVGL GFGTO CPPNK GDFGT UKGPW TCPUC J
17: HVZDU HLQPD OHLQN OHLQH VVXHV VHVPD HGFKH QGDVK DWWHM HGHUP DQQOL HEGHU VLHQX UDQVD K
18: IWAEV IMRQE PIMRO PIMRI WWYIW WIWQE IHGLI RHEWL EXXIN IHIVQ ERRPM IFHIV WMIRY VERWE L
19: JXBFW JNSRF QJNSP QJNSJ XXZJX XJXRF JIHMJ SIFXM FYYJO JIJWR FSSQN JGIJW XNJSZ WFSXF M
20: KYCGX KOTSG RKOTQ RKOTK YYAKY YKYSG KJINK TJGYN GZZKP KJKXS GTTRO KHJKX YOKTA XGTYG N
21: LZDHY LPUTH SLPUR SLPUL ZZBLZ ZLZTH LKJOL UKHZO HAALQ LKLYT HUUSP LIKLY ZPLUB YHUZH O
22: MAEIZ MQVUI TMQVS TMQVM AACMA AMAUI MLKPM VLIAP IBBMR MLMZU IVVTQ MJLMZ AQMVC ZIVAI P
23: NBFJA NRWVJ UNRWT UNRWN BBDNB BNBVJ NMLQN WMJBQ JCCNS NMNAV JWWUR NKMNA BRNWD AJWBJ Q
24: OCGKB OSXWK VOSXU VOSXO CCEOC COCWK ONMRO XNKCR KDDOT ONOBW KXXVS OLNOB CSOXE BKXCK R
25: PDHLC PTYXL WPTYV WPTYP DDFPD DPDXL PONSP YOLDS LEEPU POPCX LYYWT PMOPC DTPYF CLYDL S
(Leerzeichen dienen nur der Lesbarkeit)
Schnell wird ersichtlich, dass hier der Schlüssel 14 den Klartext ergibt.
Atbash knacken
Atbash hat einen festen Schlüssel und es gibt nur eine Möglichkeit, die man ebenfalls probieren sollte. Chiffrat:VHDZI VRMNZ OVRMP OVRMV HHFVH HVHNZ VWXSV MWZHS ZGGVQ VWVIN ZMMOR VYWVI HRVMF IZMHZ S
Klartext:
ES WAR EINMAL EIN KLEINES SUESSES MAEDCHEN DAS HATTE JEDERMANN LIEB DER SIE NUR ANSAH
Andere monoalphabetische Substitutions-Chiffren knacken
Handelt sich bei der Chiffre um eine Verschlüsselung, bei der ein Buchstabe immer durch den selben, anderen Buchstaben (oder Symbol) ersetzt wird, dann kann man sich zunutze machen, dass die Häufigkeiten der einzelnen Buchstaben in einer natürliche Sprache nicht gleich verteilt sind, sondern bestimmte Buchstaben häufiger vorkommen als andere, z. B. das 'E' in deutsch und englisch. Man muss beachten, dass eventuell Homophone oder Blender zum Einsatz kommen, die die Entzifferung erschweren. Wir wollen diese Erschwernisse aber zunächst einmal außer Acht lassen.Durch das Zählen der Buchstaben von Texten z. B. der deutschen Sprache erhält man eine statistische Häufigkeitsverteilung, die ein durchschnittlicher Klartext aufweisen sollte. Diese kann mit der Häufigkeitsverteilung des Geheimtextes verglichen werden. So kann man z. B. herausfinden, in welcher Sprache der Klartext abgefasst ist, denn die Verteilungen unterscheiden sich je nach Sprache. Auf der anderen Seite: weiß man, dass der Klartext in einer bestimmten Fachsprache abgefasst ist, z. B. Fachbereich Informatik, dann lohnt es sich evtl. IT-Fachliteratur als Grundlage für die Häufigkeitsverteilung zu benutzen, um noch genauere Prozentzahlen für die einzelnen Buchstaben für dieses Fachgebiet zu erhalten.
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Nehmen wir an, das häufigste Zeichen ist das X mit 17,38%, danach folgend das Y mit 10,02% und das Z mit 7,85%. Ein Blick in eine entsprechende Tabelle mit der Häufigkeitsverteilung ergibt, dass im Deutschen die häufigsten Buchstaben eine ganz ähnliche Häufigkeit aufweisen: E mit 17,41%, N mit 9,78% und S mit 7,89%. Dann kann man davon ausgehen, dass das chiffrierte X für ein Klartext-E steht, das Y für ein N und das Z für ein S. Dann ersetzt man entsprechend alle X durch E etc. und führt das für weitere, von der Verteilung eindeutige Buchstaben fort. Damit hat man den Großteil des Klartextes bereits wiederhergestellt. Danach beginnt man zu kombinieren und kurze oder wahrscheinliche Wörter zu erraten - das fällt besonders einfach, wenn Leer- oder Satzzeichen noch vorhanden sind. So erkannte und hinzugewonnene Klartextbuchstabe kann man wieder im Chiffrat ersetzen. Das führt man fort, bis der Klartext komplett wiederhergestellt ist. Ggf. helfen Tabellen über die häufigsten Anfangs- und Endbuchstaben oder Bi- (er, en, ch...) oder Trigramme (ich, ein, und...) oder Doppelbuchstaben (ss, nn, ll...).
Bei langen Texte sollten die Häufigkeitsverteilungen ziemlich genau auf die statistischen Werte kommen. Kürzere Texte reichen evtl. nicht für genaue Prozentzahlen, dann ist die Reihenfolge der Häufigkeit evtl. nicht die aus der statistischen Tabelle - evtl. kommt das S im anvisierten Klartext doch häufiger als das N vor. Dann darf man natürlich nicht stur nach Rezept vorgehen, sondern muss auch mal eine andere Reihenfolge probieren. Mit der entsprechenden Geduld ergibt sich dann auch ein lesabrer Klartext.
Beispiel für eine monoalphabetische Substitution mit Leer- und Satzzeichen
NP GKR NYCBKO NYC AONYCNP PSNPPNP BKNTVXNC, TKP XKQQN ZNTNRBKCC OYNU, TNR PYN CSR KCPKX, KB KOONROYNUPQNC KUNR YXRN WRDPPBSQQNR, TYN GSPPQN WKR CYVXQ, GKP PYN KOONP TNB AYCTN WNUNC PDOOQN. NYCBKO PVXNCAQN PYN YXB NYC AKNLLVXNC FDC RDQNB PKBQ, SCT GNYO YXB TKP PD GDXO PQKCT, SCT NP CYVXQP KCTNRP BNXR QRKWNC GDOOQN, XYNPP NP CSR TKP RDQAKNLLVXNC. NYCNP QKWNP PLRKVX PNYCN BSQQNR JS YXB: "ADBB, RDQAKNLLVXNC, TK XKPQ TS NYC PQSNVA ASVXNC SCT NYCN MOKPVXN GNYC, URYCW TKP TNR WRDPPBSQQNR XYCKSP; PYN YPQ ARKCA SCT PVXGKVX SCT GYRT PYVX TKRKC OKUNC. BKVX TYVX KSM, UNFDR NP XNYPP GYRT, SCT GNCC TS XYCKSPADBBPQ, PD WNX XSNUPVX PYQQPKB SCT OKSM CYVXQ FDB GNWN KU, PDCPQ MKNOOPQ TS SCT JNRURYVXPQ TKP WOKP, SCT TYN WRDPPBSQQNR XKQ CYVXQP. SCT GNCC TS YC YXRN PQSUN ADBBPQ, PD FNRWYPP CYVXQ WSQNC BDRWNC JS PKWNC SCT WSVA CYVXQ NRPQ YC KOONC NVANC XNRSB!
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Es sticht der Buchstabe N mit 13,46% als häufigster Buchstabe heraus. Dies ist zwar etwas von den 17,41% im Deutschen entfernt, aber die beste Option zu beginnen. Wir ersetzen also das N durch ein e
ABCDEFGHIJKLMNOPQRSTUVWXYZ
-------------e------------
eP GKR eYCBKO eYC AOeYCeP PSePPeP BKeTVXeC, TKP XKQQe ZeTeRBKCC OYeU, TeR PYe CSR KCPKX, KB KOOeROYeUPQeC KUeR YXRe WRDPPBSQQeR, TYe GSPPQe WKR CYVXQ, GKP PYe KOOeP TeB AYCTe WeUeC PDOOQe. eYCBKO PVXeCAQe PYe YXB eYC AKeLLVXeC FDC RDQeB PKBQ, SCT GeYO YXB TKP PD GDXO PQKCT, SCT eP CYVXQP KCTeRP BeXR QRKWeC GDOOQe, XYePP eP CSR TKP RDQAKeLLVXeC. eYCeP QKWeP PLRKVX PeYCe BSQQeR JS YXB: "ADBB, RDQAKeLLVXeC, TK XKPQ TS eYC PQSeVA ASVXeC SCT eYCe MOKPVXe GeYC, URYCW TKP TeR WRDPPBSQQeR XYCKSP; PYe YPQ ARKCA SCT PVXGKVX SCT GYRT PYVX TKRKC OKUeC. BKVX TYVX KSM, UeFDR eP XeYPP GYRT, SCT GeCC TS XYCKSPADBBPQ, PD WeX XSeUPVX PYQQPKB SCT OKSM CYVXQ FDB GeWe KU, PDCPQ MKeOOPQ TS SCT JeRURYVXPQ TKP WOKP, SCT TYe WRDPPBSQQeR XKQ CYVXQP. SCT GeCC TS YC YXRe PQSUe ADBBPQ, PD FeRWYPP CYVXQ WSQeC BDRWeC JS PKWeC SCT WSVA CYVXQ eRPQ YC KOOeC eVAeC XeRSB!
Der nächsthäufige Buchstabe ist das P mit 10,5%. Dies könnte zu n, s, i, r oder a (in dieser Reihenfolge der Wahrscheinlichkeit) passen. Das erste Wort ist gleich eP. Dies könnte es, ei und er ergeben (en und ea machen keinen Sinn). Sinn machen eher es und er, ei an einem Satzbeginn wäre eher ungewöhnlich. Das 6. Wort lautet PSePPeP. mit P=s wäre es dann sSesses, das könnte suesses (süßes) heißen. Mit rSerrer lässt sich aber kein Wort bilden. Nehmen wir also suesses an und ersetzen P durch s und S durch u.
ABCDEFGHIJKLMNOPQRSTUVWXYZ
-------------e-s--u-------
es GKR eYCBKO eYC AOeYCes suesses BKeTVXeC, TKs XKQQe ZeTeRBKCC OYeU, TeR sYe CuR KCsKX, KB KOOeROYeUsQeC KUeR YXRe WRDssBuQQeR, TYe GussQe WKR CYVXQ, GKs sYe KOOes TeB AYCTe WeUeC sDOOQe. eYCBKO sVXeCAQe sYe YXB eYC AKeLLVXeC FDC RDQeB sKBQ, uCT GeYO YXB TKs sD GDXO sQKCT, uCT es CYVXQs KCTeRs BeXR QRKWeC GDOOQe, XYess es CuR TKs RDQAKeLLVXeC. eYCes QKWes sLRKVX seYCe BuQQeR Ju YXB: "ADBB, RDQAKeLLVXeC, TK XKsQ Tu eYC sQueVA AuVXeC uCT eYCe MOKsVXe GeYC, URYCW TKs TeR WRDssBuQQeR XYCKus; sYe YsQ ARKCA uCT sVXGKVX uCT GYRT sYVX TKRKC OKUeC. BKVX TYVX KuM, UeFDR es XeYss GYRT, uCT GeCC Tu XYCKusADBBsQ, sD WeX XueUsVX sYQQsKB uCT OKuM CYVXQ FDB GeWe KU, sDCsQ MKeOOsQ Tu uCT JeRURYVXsQ TKs WOKs, uCT TYe WRDssBuQQeR XKQ CYVXQs. uCT GeCC Tu YC YXRe sQuUe ADBBsQ, sD FeRWYss CYVXQ WuQeC BDRWeC Ju sKWeC uCT WuVA CYVXQ eRsQ YC KOOeC eVAeC XeRuB!
Der nächst häufige Buchstabe ist das C mit 9,32%. Das 4. Wort lautet eYC. Dort kommt das C zum Schluss vor. Insgesamt wiederholt sich eYC 10 mal in eYC, eYCe, GeYC, seYCe, eYCBKO, AOeYCes.Ein kleiner Blick in unsere Tabelle für die häufigsten Endbuchstaben im Deutschen ergibt n (21%), e (15%), r (13%), t (10.3%), s (9.6%). Das n ist das wahrscheinlichste, das e und s haben wir bereits ersetzt und die anderen Kandidaten sind weit abgeschlagen. Außerdem wird aus eYC dann eYn, was gut zu dem sehr häufigen Wort 'ein' passen würde. eYCe würde zu eine. seYCe zu seine. GeYC zu mein oder kein. AOeYCes evtl. zu kleines. Y kommt auch entsprechend häufig vor. Das könnte gut passen. Ersetzen wir also C durch n und Y durch i.
ABCDEFGHIJKLMNOPQRSTUVWXYZ
--n----------e-s--u-----i-
es GKR einBKO ein AOeines suesses BKeTVXen, TKs XKQQe ZeTeRBKnn OieU, TeR sie nuR KnsKX, KB KOOeROieUsQen KUeR iXRe WRDssBuQQeR, Tie GussQe WKR niVXQ, GKs sie KOOes TeB AinTe WeUen sDOOQe. einBKO sVXenAQe sie iXB ein AKeLLVXen FDn RDQeB sKBQ, unT GeiO iXB TKs sD GDXO sQKnT, unT es niVXQs KnTeRs BeXR QRKWen GDOOQe, Xiess es nuR TKs RDQAKeLLVXen. eines QKWes sLRKVX seine BuQQeR Ju iXB: "ADBB, RDQAKeLLVXen, TK XKsQ Tu ein sQueVA AuVXen unT eine MOKsVXe Gein, URinW TKs TeR WRDssBuQQeR XinKus; sie isQ ARKnA unT sVXGKVX unT GiRT siVX TKRKn OKUen. BKVX TiVX KuM, UeFDR es Xeiss GiRT, unT Genn Tu XinKusADBBsQ, sD WeX XueUsVX siQQsKB unT OKuM niVXQ FDB GeWe KU, sDnsQ MKeOOsQ Tu unT JeRURiVXsQ TKs WOKs, unT Tie WRDssBuQQeR XKQ niVXQs. unT Genn Tu in iXRe sQuUe ADBBsQ, sD FeRWiss niVXQ WuQen BDRWen Ju sKWen unT WuVA niVXQ eRsQ in KOOen eVAen XeRuB!
Werfen wir als nächstes ein Blick auf die kurzen Wörter Ju und Tu. es und in sind als zweibuchstabige Wörter schon gelöst. Welche Wörter mit zwei Buchstaben und u am Ende gibt es? du, zu, nu. "zu in" in "unT Genn Tu in iXRe" macht keinen Sinn. auf "zu" folgt eigentlich nie "in", denn entweder geht man auf etwas "zu" und "in" etwas hinein. Also ist wahrscheinlich T = d. Das würde aus unT auch und machen. Dementsprechend bleibt für Ju eigentlich nur noch zu. Wir ersetzen also T durch d und J durch z.
ABCDEFGHIJKLMNOPQRSTUVWXYZ
--n------z---e-s--ud----i-
es GKR einBKO ein AOeines suesses BKedVXen, dKs XKQQe ZedeRBKnn OieU, deR sie nuR KnsKX, KB KOOeROieUsQen KUeR iXRe WRDssBuQQeR, die GussQe WKR niVXQ, GKs sie KOOes deB Ainde WeUen sDOOQe. einBKO sVXenAQe sie iXB ein AKeLLVXen FDn RDQeB sKBQ, und GeiO iXB dKs sD GDXO sQKnd, und es niVXQs KndeRs BeXR QRKWen GDOOQe, Xiess es nuR dKs RDQAKeLLVXen. eines QKWes sLRKVX seine BuQQeR zu iXB: "ADBB, RDQAKeLLVXen, dK XKsQ du ein sQueVA AuVXen und eine MOKsVXe Gein, URinW dKs deR WRDssBuQQeR XinKus; sie isQ ARKnA und sVXGKVX und GiRd siVX dKRKn OKUen. BKVX diVX KuM, UeFDR es Xeiss GiRd, und Genn du XinKusADBBsQ, sD WeX XueUsVX siQQsKB und OKuM niVXQ FDB GeWe KU, sDnsQ MKeOOsQ du und zeRURiVXsQ dKs WOKs, und die WRDssBuQQeR XKQ niVXQs. und Genn du in iXRe sQuUe ADBBsQ, sD FeRWiss niVXQ WuQen BDRWen zu sKWen und WuVA niVXQ eRsQ in KOOen eVAen XeRuB!
Weitere zweibuchstabige Wörter sind sD und dK. Für dK kommt eigentlich nur da in Frage was durch dKs=das bestätigt wird. Für sD eigentlich nur so. Demnach D=o und K=a.
ABCDEFGHIJKLMNOPQRSTUVWXYZ
--no-----za--e-s--ud----i-
es GaR einBaO ein AOeines suesses BaedVXen, das XaQQe ZedeRBann OieU, deR sie nuR ansaX, aB aOOeROieUsQen aUeR iXRe WRossBuQQeR, die GussQe WaR niVXQ, Gas sie aOOes deB Ainde WeUen soOOQe. einBaO sVXenAQe sie iXB ein AaeLLVXen Fon RoQeB saBQ, und GeiO iXB das so GoXO sQand, und es niVXQs andeRs BeXR QRaWen GoOOQe, Xiess es nuR das RoQAaeLLVXen. eines QaWes sLRaVX seine BuQQeR zu iXB: "AoBB, RoQAaeLLVXen, da XasQ du ein sQueVA AuVXen und eine MOasVXe Gein, URinW das deR WRossBuQQeR Xinaus; sie isQ ARanA und sVXGaVX und GiRd siVX daRan OaUen. BaVX diVX auM, UeFoR es Xeiss GiRd, und Genn du XinausAoBBsQ, so WeX XueUsVX siQQsaB und OauM niVXQ FoB GeWe aU, sonsQ MaeOOsQ du und zeRURiVXsQ das WOas, und die WRossBuQQeR XaQ niVXQs. und Genn du in iXRe sQuUe AoBBsQ, so FeRWiss niVXQ WuQen BoRWen zu saWen und WuVA niVXQ eRsQ in aOOen eVAen XeRuB!
Nun haben wir alle Vokale vergeben. Der noch nicht ersetzten Buchstaben sind also alles Konsonanten. Damit lassen sich jetzt gut einzelne Wörter erraten.
"deR sie nuR ansaX" könnte "der sie nur ansah" heißen (das war zu einfach). R=r macht Sinn, wie "andeRs", "nuR", "deR", "daRan" bestätigen.
"Xinaus" bestätigt X=h. "iXRe" für "ihre" sogar beide Ersetzungen.
ABCDEFGHIJKLMNOPQRSTUVWXYZ
--no-----za--e-s-rud---hi-
es Gar einBaO ein AOeines suesses BaedVhen, das haQQe ZederBann OieU, der sie nur ansah, aB aOOerOieUsQen aUer ihre WrossBuQQer, die GussQe War niVhQ, Gas sie aOOes deB Ainde WeUen soOOQe. einBaO sVhenAQe sie ihB ein AaeLLVhen Fon roQeB saBQ, und GeiO ihB das so GohO sQand, und es niVhQs anders Behr QraWen GoOOQe, hiess es nur das roQAaeLLVhen. eines QaWes sLraVh seine BuQQer zu ihB: "AoBB, roQAaeLLVhen, da hasQ du ein sQueVA AuVhen und eine MOasVhe Gein, UrinW das der WrossBuQQer hinaus; sie isQ AranA und sVhGaVh und Gird siVh daran OaUen. BaVh diVh auM, UeFor es heiss Gird, und Genn du hinausAoBBsQ, so Weh hueUsVh siQQsaB und OauM niVhQ FoB GeWe aU, sonsQ MaeOOsQ du und zerUriVhsQ das WOas, und die WrossBuQQer haQ niVhQs. und Genn du in ihre sQuUe AoBBsQ, so FerWiss niVhQ WuQen BorWen zu saWen und WuVA niVhQ ersQ in aOOen eVAen heruB!
Nun geht es schnell. Q=t: "haQQe" spricht für "hatte", bestätigt durch "isQ" = "ist" und "ihre WrossBuQQer" -> "ihre grossmutter", also auch W=g, B=m. Z=j: "ZederBann" wird zu "jedermann" und bestätigt noch einmal B=m. V=c: "niVhQ" -> "nicht", bestätigt nochmal Q=t. O=l: "aOOes" -> "alles"
ABCDEFGHIJKLMNOPQRSTUVWXYZ
-mno-----za--elstrud-cghij
es Gar einmal ein Aleines suesses maedchen, das hatte jedermann lieU, der sie nur ansah, am allerlieUsten aUer ihre grossmutter, die Gusste gar nicht, Gas sie alles dem Ainde geUen sollte. einmal schenAte sie ihm ein AaeLLchen Fon rotem samt, und Geil ihm das so Gohl stand, und es nichts anders mehr tragen Gollte, hiess es nur das rotAaeLLchen. eines tages sLrach seine mutter zu ihm: "Aomm, rotAaeLLchen, da hast du ein stuecA Auchen und eine Mlasche Gein, Uring das der grossmutter hinaus; sie ist AranA und schGach und Gird sich daran laUen. mach dich auM, UeFor es heiss Gird, und Genn du hinausAommst, so geh hueUsch sittsam und lauM nicht Fom Gege aU, sonst Maellst du und zerUrichst das glas, und die grossmutter hat nichts. und Genn du in ihre stuUe Aommst, so Fergiss nicht guten morgen zu sagen und gucA nicht erst in allen ecAen herum!
Gar = war, Gusste = wusste, Gas = was, also G=w. Aleines = kleines, schenAte = schnekte, Aomm = komm, also A=k. allerlieUsten = allerliebsten, aUer = aber, also U=b, Fon = von, also F=v
ABCDEFGHIJKLMNOPQRSTUVWXYZ
kmno-vw--za--elstrudbcghij
es war einmal ein kleines suesses maedchen, das hatte jedermann lieb, der sie nur ansah, am allerliebsten aber ihre grossmutter, die wusste gar nicht, was sie alles dem kinde geben sollte. einmal schenkte sie ihm ein kaeLLchen von rotem samt, und weil ihm das so wohl stand, und es nichts anders mehr tragen wollte, hiess es nur das rotkaeLLchen. eines tages sLrach seine mutter zu ihm: "komm, rotkaeLLchen, da hast du ein stueck kuchen und eine Mlasche wein, bring das der grossmutter hinaus; sie ist krank und schwach und wird sich daran laben. mach dich auM, bevor es heiss wird, und wenn du hinauskommst, so geh huebsch sittsam und lauM nicht vom wege ab, sonst Maellst du und zerbrichst das glas, und die grossmutter hat nichts. und wenn du in ihre stube kommst, so vergiss nicht guten morgen zu sagen und guck nicht erst in allen ecken herum!
Das L=p und M=f sind ist jetzt ein Leichtes.
ABCDEFGHIJKLMNOPQRSTUVWXYZ
kmno-vw--zapfelstrudbcghij
es war einmal ein kleines suesses maedchen, das hatte jedermann lieb, der sie nur ansah, am allerliebsten aber ihre grossmutter, die wusste gar nicht, was sie alles dem kinde geben sollte. einmal schenkte sie ihm ein kaeppchen von rotem samt, und weil ihm das so wohl stand, und es nichts anders mehr tragen wollte, hiess es nur das rotkaeppchen. eines tages sprach seine mutter zu ihm: "komm, rotkaeppchen, da hast du ein stueck kuchen und eine flasche wein, bring das der grossmutter hinaus; sie ist krank und schwach und wird sich daran laben. mach dich auf, bevor es heiss wird, und wenn du hinauskommst, so geh huebsch sittsam und lauf nicht vom wege ab, sonst faellst du und zerbrichst das glas, und die grossmutter hat nichts. und wenn du in ihre stube kommst, so vergiss nicht guten morgen zu sagen und guck nicht erst in allen ecken herum!
Folgende Begebenheiten der deutschen Sprache könnten bei der Analyse hilfreich sein:
- Auf ein Q folgt normalerweise immer ein U, auf ein C folgt häufiger ein H als ein K. SCH ist eine häufige Kombination, auf SC folgt fast immer ein H. Ein H folgt meist einem C (CH) oder einem Vokal (Lautverlängerung). Folgt auf L ein anderer Konsonant, dann steht vor dem L ein Vokal (Bild, Milch, helfen). Vor einem Doppelkonsonanten steht stets ein Vokal (Doppel, hoffen, immer), meist folgt auch ein Vokal.
- Eine Silbe enthält stets einen Vokal.
- Die Tabellen zur Häufigkeitsverteilung enthalten auch die häufigsten Wörter, Anfangs- End- und Doppelbuchstaben, Bi- und Trigramme
- Das Verhältnis von Konsonanten zu Vokalen ist etwa 5:1. Die längste Aneinanderfolge von Konsonanten in einem Wort liegt bei 5. In Texte ohne Leerzeichen kann sie bis zu 9 betragen ("Er forscht schnell nach.")
- Sobald z. B. erkannt wurde, dass ein Text in der Vergangenheitsform geschrieben ist, kann man dieses Wissen zur Eingrenzung der Verben nutzen.
ABCDEFGHIJKLMNOPQRSTUVWXYZ
kmno-vw--zapfelstrudbcghij
q xy
Es fällt auf, das es alphabetisch sortiert beginnt und das "apfelstrud" als Kennwort darin enthalten ist. Das kommt daher, dass ein Schlüssel-Alphabet verwendet wurde, das aus dem kürzeren Kennwort "Apfelstrudel" entstanden ist. So wird es beim Verschlüsselungsverfahren Aristocrat verwendet. Dies ist eine weitere Hilfe gegen Ende, wenn in etwa klar ist, wo das Kennwort beginnt. Dann kann man die fehlenden Buchstaben direkt im Ersetzungsschlüssel einsetzen. So konnten wir auch E=q, H=x, I=y festlegen, obwohl diese Buchstaben gar nicht im Text vorkommen.Aber auch ohne diese Hilfe, etwa wenn eine Monoalphabetische-Substitution Chiffre mit zwei vollständigen Alphabeten (26 komplett verwürfelte Buchstaben als Schlüssel) zum Einsatz kommt, funktioniert das obige Verfahren.
Es gibt ein Kryptoanalyse-Tool (Solver) zum manuellen brechen von monoalphabetischen Substitutions-Chiffren, das online im Browser funktioniert und von mir entwickelt wurde, um bei der Anwendung des oben beschriebenen Verfahrens zu unterstützten. Sie können damit die wichtigsten Analysen durchführen und die Ersetzungen halbautomatisch durchführen. Probieren Sie es einfach mal aus. Mit dem hier angelesenen Wissen sollten Sie sich sofort damit zurechtfinden.
Manche Verfahren wie die Kamasutra Chiffre sind involutorisch, das heißt umkehrbar. Dann wird z. B. ein "A" durch ein "t" ersetzt, andersherum aber auch das "T" durch ein "a". Das kommt daher, das bei dieser Chiffre zweimal 13 Buchstaben untereinander geschrieben werden und dann oben gegen unten oder auch unten gegen oben ersetzt wird.
Analyse von einzelnen Wortmustern
Noch einmal zurück zu unseren Chiffrat, bei dem die einzelne Wörter erkennbar sind (ein sogenanntes Aristocrat):NP GKR NYCBKO NYC AONYCNP PSNPPNP BKNTVXNC, TKP XKQQN ZNTNRBKCC OYNU, TNR PYN CSR KCPKX, KB KOONROYNUPQNC KUNR YXRN WRDPPBSQQNR, TYN GSPPQN WKR CYVXQ, GKP PYN KOONP TNB AYCTN WNUNC PDOOQN. NYCBKO PVXNCAQN PYN YXB NYC AKNLLVXNC FDC RDQNB PKBQ, SCT GNYO YXB TKP PD GDXO PQKCT, SCT NP CYVXQP KCTNRP BNXR QRKWNC GDOOQN, XYNPP NP CSR TKP RDQAKNLLVXNC. NYCNP QKWNP PLRKVX PNYCN BSQQNR JS YXB: "ADBB, RDQAKNLLVXNC, TK XKPQ TS NYC PQSNVA ASVXNC SCT NYCN MOKPVXN GNYC, URYCW TKP TNR WRDPPBSQQNR XYCKSP; PYN YPQ ARKCA SCT PVXGKVX SCT GYRT PYVX TKRKC OKUNC. BKVX TYVX KSM, UNFDR NP XNYPP GYRT, SCT GNCC TS XYCKSPADBBPQ, PD WNX XSNUPVX PYQQPKB SCT OKSM CYVXQ FDB GNWN KU, PDCPQ MKNOOPQ TS SCT JNRURYVXPQ TKP WOKP, SCT TYN WRDPPBSQQNR XKQ CYVXQP. SCT GNCC TS YC YXRN PQSUN ADBBPQ, PD FNRWYPP CYVXQ WSQNC BDRWNC JS PKWNC SCT WSVA CYVXQ NRPQ YC KOONC NVANC XNRSB!
Hier kann es sich lohnen, eine Wortmuster-Analyse, der ein eigener Artikel gewidmet ist, durchzuführen. Dazu pickt man sich ein am besten etwas längeres Wort heraus und führt dazu eine Analyse des Wortmusters durch.Das gleiche Wortmuster wie KOONROYNUPQNC haben zum Beispiel "allerliebsten" und "allerliebstem". Ein Volltreffer. "WRDPPBSQQNR" führt allerdings nicht zu "Grossmutter" sondern zu Flußmittel, weil eben die korrekte Schreibung von "Großmutter" in der Datenbank gespeichert ist. Auch RDQAKNLLVXNC liefert nur "Fichtennadel" und "Kabinettchef" und nicht die richtige Lösung "Rotkaeppchen". Wieder ist der ersetzete Umlaut schuld, denn "Rotkäppchen" ist schon in der Datenbank.
Dennoch: mit dem Ausprobieren einiger Wörter, bei denen man schnell erkennt, ob sie sinnvoll sind oder nicht, kann man hier schnell zum Ziel kommen.
Polybios knacken
Bei der Polybios-Chiffre wurde jeder Buchstabe durch ein zweiziffrige Zahl ersetzt, wobei die Ziffern zwischen 1 bis 5 (bzw. 6) liegen. Das ergibt 25 Zahlen von 11 bis 55 bzw. bei einem 6x6 Polybios-Quadrat 36 Zahlen zwischen 11 und 66. Daran lässt sich die Chiffre auch gut erkennen. Erste Maßnahme ist dann, die 25 zweistelligen Zahlen durch die Buchstaben A bis Z (ohne J) bzw. die 36 Zahlen durch A bis Z und 0 bis 9 zu ersetzen. Sodann kann obige Dechiffriermethode darauf angewandt werden.Das selbe gilt übrigens auch für ADFGX bzw. ADFGVX, nur dass hier die Buchstaben ADFGX oder ADFGVX statt der Ziffern von 1 bis 5 bzw. 1 bis 6 verwendet werden. Hier gilt es zuerst die Ziffern der Übersicht wegen zu Ziffern zu ersetzen und die sich daraus ergebenden Zahlen dann in Buchstaben. Zu beachten ist bei diesen beiden Chiffren aber, dass diese Verfahren nicht nur aus eine monoalphabetischen Substitution bestehen, sondern danach noch eine Transposition verwenden, die entsprechend zuerst zu entziffern ist.
Straddling Checkerboard knacken
Auch bei der Straddling-Checkerboard-Chiffre stehen wie bei Polybios Ziffern für Buchstaben. Dabei ist das System aber nicht so starr. Für die meistverwendete 8 Buchstaben werden meist 1-stellige Zahlen verwendet, was zwei Ziffern für zwei weitere Zeilen (2 Zeilen à 10 Spalten, also 20 Zeichen) freilässt. Das reicht für A bis Z und meist "." für Satzende und "/" für Leerzeichen.02199 89901 76528 93998 66339 98712 01799 32818 45999 42199 83190 87635 99092 78184 83182 92184 75999 41701 39899 92884 56130 19901 92513 99067 69282 99842 39906 44990 21998 21230 87281 84139 96831 35139 99317 06818 45998 31481 84891 90825 99846 80139 99230 99801 48930 17499 93897 42818 45283 99423 09899 48184 87683 19906 79288 99319 21995 17882 39087 63923 83999 38979 89917 94675 19994 12517 19963 94124 92383 1398
Auch wenn die 8 häufigsten Zeichen einstellig ersetzt werden, so muss für jedes andere Zeichen mit einer von zwei gleichbleibenden Ziffern eingeleitet werden. Diese kommen dann trotzdem (höchstwahrscheinlich) am häufigsten vor. Eine Zeichen-Auszählung kann entsprechend interpretiert werden.
Ziffern (gesamt: 349)
0: 21 6,02%
1: 43 12,32%
2: 29 8,31%
3: 35 10,03%
4: 25 7,16%
5: 13 3,72%
6: 16 4,58%
7: 20 5,73%
8: 53 15,19%
9: 94 26,93%
nach Häufigkeit sortiert: 9813240765
9 und 8 sind also die häufigsten Ziffern, wobei 9 fast doppelt so oft vorkommt wie 8, was darauf hinweist, dass hier das häufig vorkommende Leerzeichen kodiert ist.
Wir können also den Code der Reihe nach durchgehen und vor jede 8 bzw. 9 ein Leerzeichen setzen und eine zweistellige Zahl formen. So schaffen wir eine Trennung der Zeichen.
0 2 1 99 89 90 1 7 6 5 2 89 3 99 86 6 3 3 99 87 1 2 0 1 7 99 3 2 81 84 5 99 94 2 1 99 83 1 90 87 6 3 5 99 0 92 7 81 84 83 1 82 92 1 84 7 5 99 94 1 7 0 1 3 98 99 92 88 4 5 6 1 3 0 1 99 0 1 92 5 1 3 99 0 6 7 6 92 82 99 84 2 3 99 0 6 4 4 99 0 2 1 99 82 1 2 3 0 87 2 81 84 1 3 99 6 83 1 3 5 1 3 99 93 1 7 0 6 81 84 5 99 83 1 4 81 84 89 1 90 82 5 99 84 6 80 1 3 99 92 3 0 99 80 1 4 89 3 0 1 7 4 99 93 89 7 4 2 81 84 5 2 83 99 4 2 3 0 98 99 4 81 84 87 6 83 1 99 0 6 7 92 88 99 3 1 92 1 99 5 1 7 88 2 3 90 87 6 3 92 3 83 99 93 89 7 98 99 1 7 94 6 7 5 1 99 94 1 2 5 1 7 1 99 6 3 94 1 2 4 92 3 83 1 3 98
Diesmal zählen wir die Zahlen
Zahlen (gesamt: 246)
0: 15 6.10%
1: 36 14.63%
2: 15 6.10%
3: 24 9.76%
4: 10 4.07%
5: 13 5.28%
6: 15 6.10%
7: 15 6.10%
80: 2 0.81%
81: 7 2.85%
82: 4 1.63%
83: 8 3.25%
84: 10 4.07%
86: 1 0.41%
87: 5 2.03%
88: 3 1.22%
89: 6 2.44%
90: 4 1.63%
92: 10 4.07%
93: 3 1.22%
94: 5 2.03%
98: 4 1.63%
99: 31 12.60%
nach Häufigkeit sortiert: 1 (14,63%); 99 (12,6%); 3 (9,76%); 7 (6,1%); 6 (6,1%); 2 (6,1%); 0 (6,1%); 5 (5,28%); 92 (4,07%); 84 (4,07%)
Die häufige 99 wird für das Leerzeichen ("/") stehen. Meist direkt nebendran (also 98) ist in den allermeisten Fällen das andere Sonderzeichen ".". Die häufigsten Zahlen sind weiterhin 1, 3, 7, 6, 2, 0 und 5. Die 1 mit 14.63% spricht für das E, die 3 ist wahrscheinlich das N
Unser Checkerboard wird also ungefähr so aussehen:
0123456789
·E·N····--
8 ··········
9 ········./
Da in die erste Zeile die weiteren häufigen Buchstaben
1. E 17,41%
2. N 9,78%
3. S 7,89%
4. I 7,55%
5. R 7,00%
6. A 6,51%
7. T 6,15%
8. D 5,08%
S, I, R, A, T, D eingesetzt werden, ist schon abzusehen, das "DEINSTAR--" in die erste Zeile passt und der Rest alphabetisch verteilt sein wird. Das lohnt es zu überprüfen. Wir haben also ein Standard-Checkerboard zur Kodierung erwischt, dem normalerweise noch eine One-Time-Pad-Überschlüsselung mit Wurmtabelle folgen sollte.
0123456789
DEINSTAR--
8 BCFGHJKLMO
9 PQUVWXYZ./
Der Schlüssel zur Erzeugung des Straddling Checkerboards würde demnach lauten: "DeinStar,0123456789,89" und der Klartext
die operation kann leider nicht wie geplant durchgefuehrt werden. umstaende deuten darauf hin dass die feindlichen agenten verdacht geschoepft haben und besonders vorsichtig sind. schlage darum neue terminplanung vor. erwarte weitere anweisungen.
Gehen wir mal davon aus, es wäre nicht so einfach, dann würden wir im nächsten Schritt die einzelnen Zahlen durch Buchstaben ersetzen, um das Ergebnis mit der weiter oben beschriebenen Methode zu Entzifferung zu brechen. Im Code
0 2 1 99 89 90 1 7 6 5 2 89 3 99 86 6 3 3 99 87 1 2 0 1 7 99 3 2 81 84 5 99 94 2 1 99 83 1 90 87 6 3 5 99 0 92 7 81 84 83 1 82 92 1 84 7 5 99 94 1 7 0 1 3 98 99 92 88 4 5 6 1 3 0 1 99 0 1 92 5 1 3 99 0 6 7 6 92 82 99 84 2 3 99 0 6 4 4 99 0 2 1 99 82 1 2 3 0 87 2 81 84 1 3 99 6 83 1 3 5 1 3 99 93 1 7 0 6 81 84 5 99 83 1 4 81 84 89 1 90 82 5 99 84 6 80 1 3 99 92 3 0 99 80 1 4 89 3 0 1 7 4 99 93 89 7 4 2 81 84 5 2 83 99 4 2 3 0 98 99 4 81 84 87 6 83 1 99 0 6 7 92 88 99 3 1 92 1 99 5 1 7 88 2 3 90 87 6 3 92 3 83 99 93 89 7 98 99 1 7 94 6 7 5 1 99 94 1 2 5 1 7 1 99 6 3 94 1 2 4 92 3 83 1 3 98
würden wir 99 durch "/", 98 durch ".", 1 durch E, 3 durch N ersetzen. Die Zahlen der ersten Zeile 0, 3, 4, 5, 6 7 würden wir durch die häufigsten Buchstaben S, I, R, A, T, D ersetzen, um schon einmal einen Anhaltspunkt für die spätere Entzifferung zu haben. Dies nach Reihenfolge der statistischen Häufigkeit: 1=E, 3=N, 7=S, 6=I, 2=R, 0=A, 5=T, 4=D.
A R E / 89 90 E S I T R 89 N / 86 I N N / 87 E R A E S / N R 81 84 T / 94 R E / 83 E 90 87 I N T / A 92 S 81 84 83 E 82 92 E 84 S T / 94 E S A E N . / 92 88 D T I E N A E / A E 92 T E N / A I S I 92 82 / 84 R N / A I D D / A R E / 82 E R N A 87 R 81 84 E N / I 83 E N T E N / 93 E S A I 81 84 T / 83 E D 81 84 89 E 90 82 T / 84 I 80 E N / 92 N A / 80 E D 89 N A E S D / 93 89 S D R 81 84 T R 83 / D R N A . / D 81 84 87 I 83 E / A I S 92 88 / N E 92 E / T E S 88 R N 90 87 I N 92 N 83 / 93 89 S . / E S 94 I S T E / 94 E R T E S E / I N 94 E R D 92 N 83 E N .
Den Rest der nunmehr zweistelligen Zahlen ersetzen wir einfach durch die noch nicht vergebenen Buchstaben im Alphabet der Reihe nach, begonnen mit 80 und dem B.
A R E / O P E S I T R O N / K I N N / L E R A E S / N R C H T / W R E / G E P L I N T / A U S C H G E F U E H S T / W E S A E N . / U M D T I E N A E / A E U T E N / A I S I U F / H R N / A I D D / A R E / F E R N A L R C H E N / I G E N T E N / V E S A I C H T / G E D C H O E P F T / H I B E N / U N A / B E D O N A E S D / V O S D R C H T R G / D R N A . / D C H L I G E / A I S U M / N E U E / T E S M R N P L I N U N G / V O S . / E S W I S T E / W E R T E S E / I N W E R D U N G E N .
Ersetzen der Leerzeichen macht das Ganze nocheinmal übersichtlicher und wird haben eine gute Ausgangsbasis für die Dechiffrierung.
ARE OPESITRON KINN LERAES NRCHT WRE GEPLINT AUSCHGEFUEHST WESAEN. UMDTIENAE AEUTEN AISIUF HRN AIDD ARE FERNALRCHEN IGENTEN VESAICHT GEDCHOEPFT HIBEN UNA BEDONAESD VOSDRCHTRG DRNA. DCHLIGE AISUM NEUE TESMRNPLINUNG VOS. ESWISTE WERTESE INWERDUNGEN.
Das hier so viele Buchstaben bereits übereinstimmen, liegt daran, dass wir sie alphabetisch aufsteigend vergeben haben und in einem Straddling Checkerboard die Buchstaben, die nicht zum Kennwort gehören ebenfalls alphabetisch aufsteigend vergeben werden.Code / Chiffre online dekodieren / entschlüsseln bzw. kodieren / verschlüsseln (DeCoder / Encoder / Solver-Tool)
Quellen, Literaturverweise und weiterführende Links
Kasiski, Friedrich Wilhelm: Die Geheimschriften und die Dechiffrir-Kunst, Mittler & Sohn Verlag Berlin 1863, S. 13-18Schneickert, Hans: Moderne Geheimschriften, Dr. Haas'sche Druckerei 1900, S. 4
Gómez, Joan: Geheimsprachen und Decodierung, Librero Verlag 2016, S. 25
Ertel, Wolfgang: Angewandte Kryptographie, Hanser Verlag 2012, S. 36
Gaines, Helen Fouché: Cryptanalysis, Dover Verlag New York 1956, S. 73, 89
Gardner, Martin: Codes, Ciphers and Secret Writing, Dover Verlag New York 1972, S. 35