Programming lesson
Wahrscheinlichkeitstheorie für MATH 154: Von Perkolation bis P-Wert – Ein verständlicher Leitfaden
Dieser Artikel erklärt zentrale Konzepte der Wahrscheinlichkeitstheorie aus MATH 154: Bond-Perkolation, Jensens Ungleichung, Entropie, Tschebyscheffs Ungleichung und P-Werte. Mit aktuellen Beispielen aus KI, Finanzen und Gaming.
Einführung in die Wahrscheinlichkeitstheorie: MATH 154 verstehen
Die Wahrscheinlichkeitstheorie ist das Rückgrat der modernen Datenwissenschaft, Künstlichen Intelligenz und Finanzmathematik. In diesem Leitfaden behandeln wir die Kernkonzepte aus MATH 154 Homework 5: Tail algebra, Perkolation, Jensens Ungleichung, Entropie, Tschebyscheffs Ungleichung und P-Werte. Mit anschaulichen Beispielen aus der aktuellen KI-Entwicklung, Gaming-Trends und Finanzwelt machen wir die Theorie greifbar.
Bond-Perkolation in 3D: Unendliche Cluster und Schwellenwerte
Stellen Sie sich ein riesiges 3D-Gitter vor, wie die Minecraft-Welt. Jede Kante zwischen zwei benachbarten Punkten ist mit Wahrscheinlichkeit p vorhanden (offen) und mit Wahrscheinlichkeit 1-p fehlend (geschlossen). Die Bond-Perkolation untersucht, ob es einen unendlich großen zusammenhängenden Cluster offener Kanten gibt. Dieses Modell erklärt Phänomene wie die Ausbreitung von Viren in Netzwerken oder die Leitfähigkeit in Materialien.
a) Translationsinvarianz und der Satz von Kolmogorov
Der Satz von Kolmogorov (Erweiterungssatz) garantiert die Existenz eines translationsinvarianten Wahrscheinlichkeitsmaßes auf dem unendlichen Produktraum. Da die Gitterkanten unabhängig und identisch verteilt sind, ist die Wahrscheinlichkeit eines Ereignisses unabhängig von der Position im Gitter. Das ist entscheidend für die Definition von Perkolationsschwellen.
b) Monotonie der Clusterwahrscheinlichkeit
Sei A das Ereignis, dass ein unendlicher Cluster existiert. Für p ≤ q gilt: Pp[A] ≤ Pq[A]. Intuitiv: Je höher die Wahrscheinlichkeit, dass eine Kante offen ist, desto wahrscheinlicher entsteht ein riesiges Netzwerk. Formal nutzt man die Kopplungsmethode: Man konstruiert zwei Konfigurationen auf demselben Wahrscheinlichkeitsraum, sodass die Konfiguration mit größerem p alle offenen Kanten der anderen enthält.
c) Existenz eines Schwellenwerts pc
Für das 3D-Gitter existiert ein kritischer Wert pc, sodass für p < pc mit Wahrscheinlichkeit 1 kein unendlicher Cluster existiert, und für p > pc mit Wahrscheinlichkeit 1 ein unendlicher Cluster existiert. Dies folgt aus der Monotonie und dem Kolmogorov'schen 0-1-Gesetz.
d) Aktuelle Schätzung für pc im 3D-Gitter
Nach aktueller Forschung (Stand 2025) liegt die beste Schätzung für die Bond-Perkolation auf dem kubischen Gitter Z3 bei pc ≈ 0,2488. Numerische Simulationen und rigorose Methoden wie die Schlangenmethode liefern diese Grenzen.
Jensens Ungleichung: Von der Analysis zur Risikoaversion
Jensens Ungleichung ist ein mächtiges Werkzeug, das in vielen Bereichen der Mathematik, Statistik und Wirtschaft Anwendung findet. Sie besagt: Für eine konvexe Funktion f gilt f(E[X]) ≤ E[f(X)]. Für konkave Funktionen kehrt sich das Ungleichheitszeichen um.
a) Der Fall f(x) = |x|
Die Funktion f(x) = |x| ist konvex. Jensens Ungleichung liefert: |E[X]| ≤ E[|X|]. Für eine stetige Funktion auf [0,1] ergibt sich die Integralversion: |∫ g| ≤ ∫ |g|.
b) Geometrisch-arithmetisches Mittel
Für positive Zahlen a, b gilt √(ab) ≤ (a+b)/2. Die Funktion f(x) = -ln(x) ist konvex, also -ln((a+b)/2) ≤ (-ln a - ln b)/2, was nach Potenzieren die Ungleichung ergibt.
c) Risikoaversion und Portfolioptimierung
In der Finanzwelt ist die Nutzenfunktion ϕ eines risikoaversen Anlegers konkav (z.B. log(x)). Jensens Ungleichung besagt: E[ϕ(X)] ≤ ϕ(E[X]). Das bedeutet: Der erwartete Nutzen einer unsicheren Auszahlung ist geringer als der Nutzen des sicheren Erwartungswerts. Dies erklärt, warum Anleger für Risiko eine Prämie verlangen. In der aktuellen KI-gesteuerten Portfolioptimierung (z.B. bei Robo-Advisors) wird dieses Prinzip genutzt, um risikoangepasste Strategien zu entwickeln.
Entropie: Das Maß der Unordnung
Die Entropie S(A) einer σ-Algebra A ist ein Maß für die Unbestimmtheit. Für eine diskrete Zufallsvariable mit Wahrscheinlichkeiten pi ist die Shannon-Entropie H = -∑ pi log pi.
a) Konkavität von f(x) = x log(1/x)
Die Funktion f(x) = x log(1/x) ist konkav auf (0,1] mit f(0)=0. Dies ist die Grundlage für viele Entropieungleichungen.
b) Maximale Entropie der Gleichverteilung
Unter allen Verteilungen auf {1,…,n} hat die Gleichverteilung die größte Entropie. Das entspricht der maximalen Ungewissheit – ein Prinzip, das in der KI für die Exploration genutzt wird (z.B. in Reinforcement Learning mit Entropie-Bonus).
c) Entropie unabhängiger Zufallsvariablen
Sind X und Y unabhängig, dann gilt: S(AX,Y) = S(AX) + S(AY). Die Entropie des gemeinsamen Ereignisses ist die Summe der Einzelentropien. Dies entspricht der Tatsache, dass Information über unabhängige Ereignisse additiv ist.
Tschebyscheffs Ungleichung: Absicherung in der Versicherung
Angenommen, Sie leiten eine Versicherungsgesellschaft. Sie kennen den Mittelwert μ und die Standardabweichung σ der Schadenshöhen, aber nicht die genaue Verteilung. Tschebyscheffs Ungleichung gibt eine universelle Schranke: P[|X-μ| ≥ kσ] ≤ 1/k2.
a) 89% innerhalb von 3 Standardabweichungen
Setzen wir k=3: P[|X-μ| ≥ 3σ] ≤ 1/9 ≈ 0,111. Also sind mindestens 88,9% der Werte innerhalb von 3σ. Dies gilt für jede Verteilung mit endlicher Varianz.
b) Mindestens 75% innerhalb von 2 Standardabweichungen
Für k=2: P[|X-μ| ≥ 2σ] ≤ 1/4 = 0,25, also mindestens 75% innerhalb von 2σ.
c) 96% innerhalb von 5 Standardabweichungen
Um 96% zu erhalten, suchen wir k mit 1/k2 = 0,04 → k=5. Also sind mindestens 96% der Werte innerhalb von 5σ. In der Praxis (z.B. bei Aktienkursen) sind die Schranken oft konservativ.
P-Werte und statistische Signifikanz
Der P-Wert ist die Wahrscheinlichkeit, unter der Nullhypothese einen mindestens so extremen Wert zu beobachten wie den gemessenen. Ein kleiner P-Wert (≤0,05) spricht gegen die Nullhypothese.
a) Exponentialverteilung: P-Wert für X=2
Sei X exponentialverteilt mit Rate λ=1 (Mittelwert 1). Der P-Wert für den beobachteten Wert 2 ist P[X ≥ 2] = e-2 ≈ 0,135. Das ist nicht signifikant.
b) Tschebyscheff-Abschätzung des P-Werts
Für eine unbekannte Verteilung mit μ=1, σ=1 (angenommen) liefert Tschebyscheff: P[X ≥ 2] ≤ P[|X-1| ≥ 1] ≤ 1/12 = 1. Das ist sehr grob, aber eine obere Schranke.
c) Problem des wiederholten Testens (p-hacking)
Wenn Sie ein Experiment mehrmals wiederholen und nur die signifikanten Ergebnisse publizieren („Warm-up“-Runs), steigt die Wahrscheinlichkeit eines falsch-positiven Ergebnisses drastisch. Dies ist ein bekanntes Problem in der Wissenschaft (Replikationskrise).
d) Nicht-Signifikanz bedeutet nicht „kein Effekt“
Ein P-Wert > 0,05 bedeutet nur, dass die Daten nicht ausreichen, um die Nullhypothese abzulehnen. Es könnte ein Effekt existieren, der aber zu klein ist oder die Stichprobe zu schwach. Beispiel: Ein neues KI-Modell zeigt eine Verbesserung von 0,1% – bei kleiner Stichprobe ist das nicht signifikant, aber der Effekt könnte real sein.
Fazit
Die Konzepte aus MATH 154 – Perkolation, Jensens Ungleichung, Entropie, Tschebyscheff und P-Werte – sind nicht nur theoretisch spannend, sondern haben direkte Anwendungen in KI, Finanzen, Gaming und Wissenschaft. Das Verständnis dieser Grundlagen hilft, bessere Entscheidungen in einer datengetriebenen Welt zu treffen.