Wie häufig kommen eigentlich einzelne Buchstaben in der deutschen Sprache vor?

In einem Gespräch mit Studierenden kamen wir auf das Thema, wie häufig eigentlich bestimmte Buchstaben in der deutschen Sprache sind. Gute Frage, aber auch darauf findet man mit Mathematica eine Antwort. Als erstes besorgen wir uns mal die Wörter die im deutschen Wörterbuch (von Mathematica) drin sind, dies geht mit dem Befehl:
woerterbuch = DictionaryLookup[{"German", ___}];
Es sind übrigens 76.155 Wörter. Die insgesamt 885.541 Buchstaben erhält man mit:
buchstaben = Flatten[Characters[#] & /@ woerterbuch];
Mithilfe des Befehls "Gather" erhält man daraus Teillisten die nur aus gleichen Buchstaben bestehen, kann so also die Häufigkeit eines jeden Buchstabens leicht ermitteln:
temp = Gather @ buchstaben;
haeufigkeiten = {First[#], Length[#]} & /@ temp

Jetzt nur noch sortieren, etwas umgruppieren und man hat die hier rechts oben abgebildete Darstellung der Häufigkeiten:
sortierteHaeufigkeiten = SortBy[haeufigkeiten, Last]
Grid[Partition[Reverse @ sortierteHaeufigkeiten, 5, 5, {1, 1}, {"-"} ], Frame -> All]

My Image

Erwartungsgemäß ist das kleine "e" der häufigste Buchstabe und das große "Y" der seltenste, aber das sich das kleine "y" weiter besser schlägt, als das große "I"... interessant. Also noch eine Grafik der 20 seltensten Buchstaben
BarChart[Last /@ sortierteHaeufigkeiten[[1 ;; 20]], ChartLabels -> First /@  sortierteHaeufigkeiten[[1 ;; 20]], ColorFunction -> "TemperatureMap"]

My Image

Die zehn "Spitzenreiter" erhält man auch ganze einfach:
BarChart[Last /@ (sortierteHaeufigkeiten)[[50 ;; 59]], ChartLabels -> First /@  sortierteHaeufigkeiten[[50 ;; 59]], ColorFunction -> "TemperatureMap"]
So hat ein kleiner Plausch mit Studierenden mal mindestens die Erkenntnis gebracht, daß das große "Ä" der drittseltenste Buchstabe des deutschen Alphabets ist.
Wer übrigens mal einen Roman lesen will, in dem der Buchstabe "e" nicht vorkommt, dem sei hier "Anton Voyls Fortgang" empfohlen.

My Image