Programming lesson
Zentraler Grenzwertsatz und Cauchy-Verteilung: Ein Tutorial für MATH154
Lerne die charakteristische Funktion der Cauchy-Verteilung, die Faltungsstabilität und die Entropie im Kontext des zentralen Grenzwertsatzes. Mit aktuellen Beispielen aus KI und Finanzen.
Einführung: Warum der zentrale Grenzwertsatz auch für die Cauchy-Verteilung spannend ist
Der zentrale Grenzwertsatz (ZGS) ist ein Eckpfeiler der Wahrscheinlichkeitstheorie. Er besagt, dass die Summe vieler unabhängiger, identisch verteilter Zufallsvariablen (mit endlicher Varianz) approximativ normalverteilt ist. Doch was passiert, wenn die Varianz unendlich ist? Die Cauchy-Verteilung ist ein Paradebeispiel: Sie hat keinen Erwartungswert und keine Varianz im klassischen Sinne. Trotzdem gehorcht sie einem eigenen „zentralen Grenzwertsatz“ – dem Stabilitätssatz. In diesem Tutorial lernst du die charakteristische Funktion, die Faltungseigenschaft und die Entropie der Cauchy-Verteilung kennen. Wir verbinden die Theorie mit aktuellen Trends wie KI-Modellen (z.B. Rauschen in generativen Modellen) und Finanzmathematik (wo Cauchy-ähnliche Verteilungen bei Aktienkursen auftreten).
1. Charakteristische Funktion der Cauchy-Verteilung (Aufgabe 9.1a)
Die charakteristische Funktion einer Zufallsvariable X ist definiert als φ_X(t) = E[e^{itX}]. Für eine standard Cauchy-verteilte Zufallsvariable mit Dichte f(x) = 1/(π(1+x^2)) lautet die charakteristische Funktion φ_X(t) = e^{-|t|}. Dies kann man mit Residuenkalkül oder über die Fourier-Transformation der Cauchy-Dichte zeigen. Der Beweis nutzt den Satz von Cauchy und die Symmetrie des Integrals. Ein Tipp: Integriere e^{itz}/(1+z^2) über einen Halbkreis in der oberen Halbebene für t>0. Das Residuum bei z=i liefert das Ergebnis. Für t<0 schließt man in der unteren Halbebene.
Schritt-für-Schritt mit Residuenkalkül
- Betrachte das Integral I = ∫_{-∞}^{∞} e^{itx}/(π(1+x^2)) dx.
- Erweitere auf komplexe Ebene: ∫ e^{itz}/(1+z^2) dz.
- Schließe den Integrationsweg durch einen Halbkreis mit Radius R→∞ in der oberen Halbebene (t>0).
- Das Integral über den Halbkreis verschwindet aufgrund des Lemmas von Jordan.
- Das Residuum bei z=i ist e^{-t}/(2i). Mit dem Residuensatz erhältst du φ_X(t)=e^{-t} für t>0.
- Für t<0 analog in der unteren Halbebene: φ_X(t)=e^{t}. Insgesamt φ_X(t)=e^{-|t|}.
Diese elegante Funktion zeigt, dass die Cauchy-Verteilung stabil ist: Die Summe unabhängiger Cauchy-Variablen ist wieder Cauchy-verteilt (mit skalierter Breite).
2. Faltungsstabilität: (X+Y)/2 ist wieder Cauchy (Aufgabe 9.1b)
Seien X und Y unabhängige standard Cauchy-verteilte Zufallsvariablen. Ihre charakteristischen Funktionen sind φ_X(t)=φ_Y(t)=e^{-|t|}. Für die Summe S = X+Y gilt φ_S(t) = φ_X(t)φ_Y(t) = e^{-2|t|}. Die charakteristische Funktion von (X+Y)/2 ist φ_{(X+Y)/2}(t) = φ_S(t/2) = e^{-2|t/2|} = e^{-|t|}. Das ist exakt die charakteristische Funktion einer standard Cauchy-Verteilung. Da die charakteristische Funktion die Verteilung eindeutig bestimmt, folgt: (X+Y)/2 ~ Cauchy(0,1). Dies ist ein Spezialfall der Stabilitätseigenschaft: Die Cauchy-Verteilung ist eine 1-stabile Verteilung. Im Gegensatz zur Normalverteilung (die 2-stabil ist) bleibt sie unter Mittelung identisch – ein Phänomen, das in der Signalverarbeitung bei der Analyse von Rauschen mit schweren Enden relevant ist. Aktuell nutzen KI-Forscher stabile Verteilungen, um generative Modelle wie Diffusionsmodelle zu verbessern, da Cauchy-Rauschen realistischere Bilder mit starken Kontrasten erzeugen kann.
3. Differentialentropie der Cauchy-Verteilung (Aufgabe 9.2a)
Die Differentialentropie einer stetigen Verteilung mit Dichte f ist definiert als h(X) = -∫ f(x) log f(x) dx. Für die Cauchy-Verteilung ergibt sich h = log(4π). Dies kann man durch Substitution x = tan θ berechnen: ∫_{-π/2}^{π/2} (1/π) log(π(1+tan^2θ)) dθ = log(π) + (2/π) ∫_0^{π/2} log(sec^2θ) dθ = log(π) + (4/π) ∫_0^{π/2} (-log(cosθ)) dθ. Das Integral ∫_0^{π/2} log(cosθ) dθ = -π/2 log 2, also h = log(π) + (4/π)*(π/2 log 2) = log(π) + 2 log 2 = log(4π). Ein häufiger Fehler in Software wie Mathematica ist, dass sie fälschlicherweise log(π) ausgibt, weil sie die Dichte nicht korrekt normiert. Die Entropie ist ein Maß für die Unsicherheit: Die Cauchy-Verteilung hat eine höhere Entropie als die Normalverteilung (log(√(2πe)) ≈ 1.42 vs. log(4π) ≈ 2.53), da sie schwerere Enden hat und somit „überraschender“ ist. In der Informationstheorie wird dies genutzt, um robuste Kodierungen zu entwerfen.
Renormierte Erwartungswerte (Aufgabe 9.2b, c)
Da der Erwartungswert der Cauchy-Verteilung nicht existiert (das Integral divergiert), verwendet man eine Renormierung: E[X] = lim_{a→∞} ∫_{-a}^{a} x/(π(1+x^2)) dx = 0, weil der Integrand ungerade ist. Diese „renormierte“ Erwartung ist 0. Die Varianz im klassischen Sinne existiert nicht, aber die renormierte Varianz lim_{a→∞} (∫_{-a}^{a} x^2/(π(1+x^2)) dx - (∫_{-a}^{a} x/(π(1+x^2)) dx)^2 ) divergiert ebenfalls. Tatsächlich wächst das zweite Moment logarithmisch: ∫_{-a}^{a} x^2/(1+x^2) dx = 2a - 2 arctan a, also divergiert es linear. Daher hat die Cauchy-Verteilung keine endliche Varianz – ein Grund, warum der klassische ZGS nicht anwendbar ist. In der Finanzmathematik werden solche Verteilungen verwendet, um extreme Kurssprünge („fat tails“) zu modellieren, wie sie bei Kryptowährungen oder Flash Crashes auftreten.
4. Entropievergleich: Cauchy vs. Normalverteilung (Aufgabe 9.3a, b)
Die Entropie der Standardnormalverteilung N(0,1) ist h = (1/2) log(2πe) ≈ 1.4189. Die Cauchy-Entropie ist log(4π) ≈ 2.5310. Also ist die Cauchy-Entropie deutlich größer. Das liegt an den schweren Enden: Die Cauchy-Verteilung weist eine höhere Unsicherheit auf, da extreme Werte wahrscheinlicher sind. In der Praxis bedeutet das: Wenn du ein KI-Modell mit Cauchy-Rauschen trainierst, ist die Ausgabe vielfältiger, aber auch instabiler. In der Spieltheorie oder bei E-Sports-Turnieren (wie den aktuellen Valorant-Champions 2026) könnte man die Verteilung von Spielerleistungen mit Cauchy modellieren, wenn es oft Ausreißer gibt (z.B. ein Spieler mit extrem gutem oder schlechtem Match). Die höhere Entropie spiegelt die Unvorhersehbarkeit wider.
5. Faltung von Maßen und Fixpunkte (Aufgabe 9.4)
Die Faltung von Wahrscheinlichkeitsmaßen ist ein zentrales Werkzeug. Für absolutstetige Maße mit Dichten f und g gilt (f * g)(x) = ∫ f(y)g(x-y) dy. Die Identität ∫ (f*g)(z) h(z) dz = ∫∫ h(x+y) f(y) g(z) dy dz folgt aus Fubini. Dies führt zur Definition: (μ * ν)(A) = ∫∫ 1_A(x+y) dμ(x) dν(y). Die Fixpunktgleichung μ = μ * μ (bis auf Skalierung) charakterisiert stabile Verteilungen. Die Cauchy-Verteilung ist ein Fixpunkt: Wenn man zwei unabhängige Cauchy-Variablen mittelt, erhält man wieder eine Cauchy-Verteilung (siehe Aufgabe 9.1b). Dies ist analog zu selbstähnlichen Fraktalen in der Computergrafik, die durch Iteration entstehen. In der KI-Forschung werden solche Fixpunkte genutzt, um neuronale Netze mit unendlicher Tiefe zu analysieren (z.B. Neural ODEs).
6. Beweis des de Moivre-Laplace-Theorems (Aufgabe 9.5)
Der de Moivre-Laplace-Theorem ist ein Spezialfall des ZGS für binomialverteilte Zufallsvariablen. Er besagt, dass die standardisierte Binomialverteilung gegen die Standardnormalverteilung konvergiert. Du kannst ihn mit der Stirling-Approximation oder charakteristischen Funktionen beweisen.
Beweis mit Stirling (Option a)
Sei S_n ~ Bin(n, p) mit p fest. Dann ist P(S_n = k) = n!/(k!(n-k)!) p^k (1-p)^{n-k}. Setze k = np + x√(np(1-p)). Mit Stirling n! ∼ √(2πn) (n/e)^n erhältst du nach langer Rechnung: P(S_n = k) ∼ 1/√(2πnp(1-p)) e^{-x^2/2}. Dies ist die Dichte der Normalverteilung. Die Approximation wird in der Datenanalyse verwendet, um Konfidenzintervalle für Umfrageergebnisse zu berechnen – z.B. bei den US-Wahlen 2026.
Beweis mit charakteristischen Funktionen (Option b)
Die charakteristische Funktion von (S_n - np)/√(np(1-p)) konvergiert gegen e^{-t^2/2}, die charakteristische Funktion der Normalverteilung. Der Beweis nutzt die Entwicklung der charakteristischen Funktion einer Bernoulli-Variable: φ(t) = 1 - p(1-p)t^2/2 + o(t^2). Nach Potenzieren und Grenzübergang folgt das Ergebnis. Dieser elegante Weg wird in der Machine-Learning-Theorie verwendet, um die asymptotische Verteilung von Schätzern zu bestimmen.
Zusammenfassung
Die Cauchy-Verteilung ist ein faszinierendes Gegenbeispiel zum klassischen ZGS. Sie zeigt, dass der ZGS nicht universell ist – er benötigt endliche Varianz. Dennoch besitzt die Cauchy-Verteilung eigene Stabilitätseigenschaften und eine höhere Entropie, was sie für Anwendungen in der Finanzmathematik, Signalverarbeitung und generativen KI interessant macht. Mit den Methoden der charakteristischen Funktionen und der Faltung kannst du tiefere Einblicke in die Struktur von Wahrscheinlichkeitsverteilungen gewinnen. Viel Erfolg bei deiner MATH154-Hausaufgabe!