Häufigkeitsverteilung
Kategorisierung: | Klassisch / Substitution |
Herkunft / Verwendung: |
Die Gesamtheit der Häufigkeiten der einzelnen Buchstaben (oder Buchstabengruppen) eines Textes im Verhältnis zum Gesamttext wird Häufigkeitsverteilung genannt. Sie wird meist in pro 100 (Prozent) oder pro 1000 (Promille) angegeben. Die Häufigkeit der Buchstaben ist für eine Sprache charakteristisch. So ist das 'E' im deutschen mit einer Häufigkeit von 17,4% der meist verwendete Buchstabe. Im englischen dagegen hat das 'E' nur einen Anteil von 12,7%. Die Häufigkeitsverteilung bleibt bei monoalphabetischen Substitutionschiffren auch nach dem Verschlüsseln erhalten, da die Buchstaben ja nur gegeneinander ausgetauscht werden. So lassen sich Rückschlüsse auf die Sprache machen und ein so chiffrierter Text dechiffrieren, indem man den meisthäufigsten Buchstaben im Chiffrat durch den meisthäufigsten Buchstaben der Sprache ('E') ersetzt, den zweithäufigsten ebenso usw. Durch Austausch von Buchstaben durch welche mit ähnlicher Verteilung kann man so Wortteile kombinieren und schlussendlich den Gesamttext entziffern. Auch bei Dechiffrierung von polyalphabetischen Substitutionschiffren kann die Häufigkeitsverteilung von Nutzen sein, z. B. bei der Bestimmung der Schlüssellänge einer Vigenere Chiffre. Bei dieser Chiffre wird ein kurzes Schlüsselwort zum Chiffrieren ständig wiederholt. Durch Duchteten eines Intervals und Zusammenführen der verteilten Buchstaben im Interval führt man probeweise ursprünglich im Klartext zusammengehörige Buchstaben wieder zusammen, beim Interval 5 z. B. den 1., 6., 11.,16. usw. Buchstaben. Auch wenn die einzelnen Buchstaben in einem so zusammengeführten Text noch chiffriert sind, wurde durch das Zusammenführen die ursprüngliche Häufigkeitsverteilung wiederhergestellt, wenn der Interval der richtige ist. Eine elegante Abkürzung zu diesem Vorgehen stellt der Friedman-Test dar. Man kann allerdings nicht nur die Häufigkeit von Einzelbuchstaben zählen , sondern dies auch für Zweipaare (Bigramme) und Dreierpaare (Trigramme) tun. Sind die Leerzeichen in einem Chiffrat erhalten geblieben, kann man auch auf ...
|
Tabellen und Diagramme
Hinweis zu den Tabellen: Alle Werte in den Tabellen sind annähernde Werte und abhängig davon, welchen Text bzw. welche Art von Texten man der Buchstabenzählung zugrunde legt. Dabei wird es Abweichungen geben, je nachdem, ob man z. B. Zeitungen, Romane oder wissenschaftliche Abhandlungen (evtl. auch zu speziellen Gebieten) als Grundlage nimmt. Zudem ist die Sprache selbst Änderungen unterworfen, z. B. wird seit der Rechtschreibreform von 1996 'daß' nun als 'dass' geschrieben. 'Daß' war ein relativ häufiges Wort. Dies hat zur Folge, dass sich der Anteil des 'ß' vermindert und der des 's' erhöht.Einzelbuchstaben
Die Häufigkeitsverteilung von Einzelbuchstaben (A-Z) in verschiedenen Sprachen:Bst. | deutsch | englisch | französisch | spanisch | italienisch | schwedisch | portugiesisch |
---|---|---|---|---|---|---|---|
A | 6,51% | 8,17% | 7,94% | 12,53% | 11,74% | 9,30% | 13,5% |
B | 1,89% | 1,49% | 0,90% | 1,42% | 0,92% | 1,30% | 0,5% |
C | 3,06% | 2,78% | 3,26% | 4,68% | 4,50% | 1,30% | 3,5% |
D | 5,08% | 4,25% | 3,67% | 5,86% | 3,73% | 4,50% | 5% |
E | 17,41% | 12,70% | 17,11% | 13,68% | 11,79% | 9,90% | 13% |
F | 1,66% | 2,23% | 1,07% | 0,69% | 0,95% | 2,00% | 1% |
G | 3,01% | 2,02% | 0,87% | 1,01% | 1,64% | 3,30% | 1% |
H | 4,76% | 6,09% | 0,74% | 0,70% | 1,54% | 2,10% | 1% |
I | 7,55% | 6,98% | 7,58% | 6,25% | 11,28% | 5,10% | 6% |
J | 0,27% | 0,15% | 0,55% | 0,44% | 0% | 0,70% | 0,5% |
K | 1,21% | 0,77% | 0,05% | 0% | 0% | 3,20% | 0% |
L | 3,44% | 4,03% | 5,46% | 4,97% | 6,51% | 5,20% | 3,5% |
M | 2,53% | 2,41% | 2,97% | 3,15% | 2,51% | 3,50% | 4,5% |
N | 9,78% | 6,75% | 7,10% | 6,71% | 6,88% | 8,80% | 5,5% |
O | 2,51% | 7,51% | 5,38% | 8,68% | 9,83% | 4,10% | 11,5% |
P | 0,79% | 1,93% | 3,02% | 2,51% | 3,05% | 1,70% | 3% |
Q | 0,02% | 0,10% | 1,36% | 0,88% | 0,51% | 7,00% | 1,5% |
R | 7,00% | 5,99% | 6,55% | 6,87% | 6,37% | 8,30% | 7,5% |
S | 7,89% | 6,33% | 7,95% | 7,98% | 4,98% | 6,30% | 7,5% |
T | 6,15% | 9,06% | 7,24% | 4,63% | 5,62% | 8,70% | 4,5% |
U | 4,35% | 2,76% | 6,37% | 3,93% | 3,01% | 1,80% | 4% |
V | 0,67% | 0,98% | 1,63% | 0,90% | 2,10% | 2,40% | 1,5% |
W | 1,89% | 2,36% | 0,11% | 0,02% | 0% | 0,03% | 0% |
X | 0,03% | 0,15% | 0,39% | 0,22% | 0% | 0,10% | 0,2% |
Y | 0,04% | 1,97% | 0,31% | 0,90% | 0% | 0,60% | 0% |
Z | 1,13% | 0,07% | 0,14% | 0,52% | 0,49% | 0,02% | 0,3% |
*Die Sonderzeichen à, á, â, ç, è, é, ê, ë, ì, î, ï, ò, ó, ù, ú, œ, ż wurden wie a, c, e, i, o, u, oe, z gezählt.
Häufigkeitsgebirge deutsch
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Häufigkeitsgebirge englisch
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Häufigkeitsgebirge französisch
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Häufigkeitsgebirge spanisch
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Häufigkeitsgebirge italienisch
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Häufigkeitsgebirge schwedisch
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Häufigkeitsgebirge portugiesisch
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
Die häufigsten Buchstaben im Deutschen
Platz | Buchstabe | Relative Häufigkeit | |
---|---|---|---|
1. | E | 17,41% | ![]() |
2. | N | 9,78% | ![]() |
3. | S | 7,89% | ![]() |
4. | I | 7,55% | ![]() |
5. | R | 7,00% | ![]() |
6. | A | 6,51% | ![]() |
7. | T | 6,15% | ![]() |
8. | D | 5,08% | ![]() |
9. | U | 4,35% | ![]() |
10. | L | 3,44% | ![]() |
Die häufigsten Anfangsbuchstaben im Deutschen
Platz | Buchstabe | Relative Häufigkeit | |
---|---|---|---|
1. | D | 14,2% | ![]() |
2. | S | 10,8% | ![]() |
3. | E | 7,8% | ![]() |
4. | I | 7,1% | ![]() |
5. | W | 6,8% | ![]() |
*Angaben für Fließtext, für z. B. Lexika gelten andere Werte
Die häufigsten Endbuchstaben im Deutschen
Platz | Buchstabe | Relative Häufigkeit | |
---|---|---|---|
1. | N | 21,0% | ![]() |
2. | E | 15,1% | ![]() |
3. | R | 13,0% | ![]() |
4. | T | 10,3% | ![]() |
5. | S | 9,6% | ![]() |
*Angaben für Fließtext, für z. B. Lexika gelten andere Werte
Bigramme
Die Häufigkeitsverteilung von Bigrammen (A.. ..B) im Deutschen in %% (Vorkommen pro 10.000 Zeichen):..A | ..B | ..C | ..D | ..E | ..F | ..G | ..H | ..I | ..J | ..K | ..L | ..M | ..N | ..O | ..P | ..Q | ..R | ..S | ..T | ..U | ..V | ..W | ..X | ..Y | ..Z | |
A.. | 8 | 31 | 27 | 11 | 64 | 15 | 30 | 20 | 5 | 1 | 7 | 59 | 28 | 102 | - | - | 51 | 53 | 46 | 75 | 2 | 3 | - | 1 | 2 | |
B.. | 16 | 1 | - | 1 | 101 | - | 3 | 1 | 12 | - | 1 | 9 | - | 1 | 8 | - | - | 9 | 6 | 4 | 14 | - | 1 | - | 1 | 1 |
C.. | 2 | - | - | 2 | 1 | - | - | 242 | 1 | - | 14 | 1 | - | - | 2 | - | - | - | 1 | - | - | - | - | - | - | - |
D.. | 54 | 3 | 1 | 13 | 227 | 3 | 4 | 2 | 93 | 1 | 3 | 5 | 4 | 6 | 9 | 3 | - | 10 | 11 | 6 | 16 | 3 | 4 | - | - | 3 |
E.. | 26 | 45 | 25 | 51 | 23 | 26 | 50 | 57 | 193 | 3 | 19 | 63 | 55 | 400 | 6 | 13 | 1 | 409 | 140 | 55 | 36 | 14 | 23 | 2 | 1 | 11 |
F.. | 19 | 2 | - | 9 | 25 | 12 | 3 | 1 | 7 | - | 1 | 5 | 1 | 2 | 9 | 1 | - | 18 | 4 | 20 | 24 | 1 | 1 | - | - | 1 |
G.. | 20 | 3 | - | 12 | 147 | 2 | 3 | 3 | 19 | 1 | 3 | 9 | 3 | 5 | 6 | 1 | - | 14 | 18 | 18 | 11 | 4 | 3 | - | - | 3 |
H.. | 70 | 4 | 1 | 14 | 102 | 2 | 4 | 3 | 23 | 1 | 3 | 25 | 11 | 19 | 18 | 1 | - | 37 | 11 | 47 | 11 | 4 | 9 | - | - | 3 |
I.. | 7 | 7 | 76 | 20 | 163 | 5 | 38 | 12 | 1 | 1 | 12 | 25 | 27 | 168 | 20 | 2 | - | 17 | 79 | 78 | 3 | 5 | 1 | - | - | 5 |
J.. | 7 | - | - | - | 9 | 5 | - | - | - | - | - | - | - | - | 2 | - | - | - | - | - | 5 | - | - | - | - | - |
K.. | 28 | 1 | - | 2 | 26 | 1 | 1 | 1 | 7 | - | 1 | 10 | 1 | 1 | 24 | 1 | - | 13 | 5 | 14 | 9 | 1 | 1 | - | - | 1 |
L.. | 45 | 7 | 2 | 14 | 65 | 5 | 6 | 2 | 61 | 1 | 7 | 42 | 3 | 4 | 14 | 2 | - | 2 | 22 | 27 | 13 | 3 | 2 | - | - | 3 |
M.. | 40 | 6 | 1 | 8 | 50 | 4 | 4 | 3 | 44 | 2 | 3 | 4 | 23 | 3 | 15 | 7 | - | 2 | 10 | 8 | 14 | 4 | 3 | - | - | 2 |
N.. | 68 | 23 | 5 | 187 | 122 | 19 | 94 | 17 | 65 | 5 | 25 | 10 | 23 | 43 | 18 | 10 | - | 10 | 74 | 59 | 33 | 18 | 29 | - | - | 25 |
O.. | 3 | 8 | 15 | 7 | 25 | 6 | 5 | 9 | 1 | 1 | 3 | 31 | 17 | 64 | 1 | 6 | - | 50 | 19 | 9 | 3 | 3 | 7 | - | 1 | 6 |
P.. | 16 | - | - | 3 | 10 | 6 | - | 2 | 4 | - | - | 4 | - | - | 11 | 5 | - | 23 | 1 | 3 | 4 | - | - | - | - | - |
Q.. | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 2 | - | - | - | - | - |
R.. | 80 | 25 | 9 | 67 | 112 | 18 | 27 | 19 | 52 | 4 | 23 | 18 | 20 | 31 | 30 | 9 | - | 15 | 54 | 49 | 48 | 12 | 17 | - | - | 14 |
S.. | 36 | 10 | 89 | 20 | 99 | 7 | 13 | 9 | 65 | 2 | 11 | 9 | 12 | 7 | 28 | 22 | - | 8 | 76 | 116 | 15 | 9 | 10 | - | 2 | 7 |
T.. | 57 | 8 | 1 | 35 | 185 | 5 | 10 | 14 | 59 | 2 | 4 | 11 | 9 | 9 | 15 | 3 | - | 31 | 50 | 23 | 26 | 8 | 21 | - | 1 | 26 |
U.. | 3 | 8 | 16 | 5 | 78 | 27 | 8 | 4 | 2 | - | 3 | 7 | 21 | 119 | - | 5 | - | 33 | 48 | 23 | 1 | 3 | 2 | - | - | 1 |
V.. | 3 | - | - | - | 37 | - | - | - | 9 | - | - | - | - | - | 43 | - | - | - | - | - | - | - | - | - | - | - |
W.. | 34 | - | - | - | 48 | - | - | - | 36 | 1 | - | - | - | 1 | 17 | - | - | - | 1 | - | 9 | - | - | - | - | - |
X.. | - | - | - | - | - | - | - | - | 1 | - | - | - | - | - | 1 | - | - | - | - | 1 | - | - | - | - | - | - |
Y.. | - | - | - | - | 1 | - | - | - | - | - | - | 1 | 1 | - | - | - | - | - | 1 | - | - | - | - | - | - | - |
Z.. | 4 | 1 | - | 1 | 28 | - | 1 | - | 11 | - | 1 | 2 | 1 | - | 2 | - | - | - | 1 | 7 | 43 | 1 | 9 | - | - | 1 |
Die häufigsten Bigramme im Deutschen
|
Die häufigsten Bigramme im Englischen
|
Die häufigsten Doppelbuchstaben im Deutschen
|
Die häufigsten Doppelbuchstaben im Englischen
|
Trigramme
Die häufigsten Trigramme im Deutschen
|
Die häufigsten Trigramme im Englischen
|
Wörter
Die häufigsten Wörter im DeutschenDie 30 häufigsten Wörter ergeben zusammen 31.8% aller Wörter:
die, der, und, in, zu, den, das, nicht, von, sie, ist, des, sich, mit, dem, dass, er, es, ein, ich, auf, so, eine, auch, als, an, nach, wie, im, für
Die nächsten 70 Wörter machen 15.3% aller Wörter aus:
man, aber, aus, durch, wenn, nur, war, noch, werden, bei, hat, wir, was, wird, sein, einen, welche, sind, oder, zur, um, haben, einer, mir, über, ihm, diese, einem, ihr, uns, da, zum, kann, doch, vor, dieser, mich, ihn, du, hatte, seine, mehr, am, denn, nun, unter, sehr, selbst, schon, hier, bis, habe, ihre, dann, ihnen, seiner, alle, wieder, meine, Zeit, gegen, vom, ganz, einzelnen, wo, muss, ohne, eines, können, sei
Die häufigsten Wörter im Englischen
the (6.42%), of (4.02%), and (3.15%), to (2.37%), a (2.09%), in (1.78%), that (1.24%), is (1.03%), I (0.95%), it (0.93%), for, as, with, was, his, he, be, not, by, but, have, you, which, are, on (0.48 %), or, her, had, at, from, this, my, they, all, their, an, she, has, were, me, been, him, one, so, if, will, there, who, no, we (0.26 %), when, what, your, more, would, them, some, than, may, upon, its, out, into, our, these, man, up, do, like, shall, great, now, such, should, other (0.13%), only, any, then, about, those, can, made, well, old, must, us, said, time, even, new, could, very, much, own, most, might, first, ater, yet, two (0.10%)
Zweibuchstabige Wörter im Deutschen
mit 'a': | ab, am, an, da, ja |
mit 'e': | eh, er, es, je |
mit 'i': | im, in |
mit 'o': | ob, so, wo |
mit 'u': | du, um, zu, nu |
Zweibuchstabige Wörter im Englischen
mit 'a': | an, at, as, am |
mit 'e': | he, be, me, we |
mit 'i': | in, is, it, if |
mit 'o': | on, or, to, of, do, go, no, so |
mit 'u': | up, us |
mit 'y': | by, my |
Code / Chiffre online dekodieren / entschlüsseln bzw. kodieren / verschlüsseln (DeCoder / Encoder / Solver-Tool)
Sie können beim Häufigkeitsgebirge als Parameter Periode (p, angenommene Schlüssellänge), Start (s) und Ausgabeverschiebung (v, optional), durch Kommata getrennt, angeben. Dann wird die Verteilung nur für die Untergruppe der Zeichen an Position s, s+p, s+p*2... errechnet. Ist eine Ausgabeverschiebung angegeben, so beginnt die Tabelle mit dem v. Buchstaben für einen besseren Vergleich der Balken.Verschlüsseln Sie den obigen Klartext aus dem Eingabefeld dann mit der Vigenere Chiffre und dem Kennwort "Apfelstrudel" und kopieren Sie dann das Chiffrat in das Eingabefeld und lassen Sie erneut zählen.
Achten Sie bei Klartext und Chiffrat auf die höchste Häufigkeit. Lag diese im Klartext bei 'E' noch bei fast 19%, liegt die höchste Häufigkeit im Chiffrat nun bei 'H' bei nur noch 6,1%. Die Verteilung wurde also durch den Einsatz einer polyalphabetischen Chiffre sehr viel gleichmäßiger.
Quellen, Literaturverweise und weiterführende Links
Singh, Simon: Geheime Botschaften, Hanser Verlag 2000, S. 35Franke, Herbert W.: Die geheime Nachricht, Umschau Verlag 1982, S. 62
Bauer, Friedrich L.: Entzifferte Geheimnisse, Springer Verlag 1995, S. 213
Gaines, Helen Fouché: Cryptanalysis, Dover Verlag New York 1956, S. 219
Kuhn, Nico: Das Buch der geheimen Verschlüsselungstechniken, Data Becker Verlag 2009, S. 19
Google NGram-Viewer: Anzeige von Anteilen von N-Grammen (mit Historie)