Das Geburtstagsparadoxon

In einem Mathe-Blog wird gefragt: Wie groß muss eine wild zusammengewürfelte Personengruppe sein, dass mit einer Wahrscheinlichkeit von wenigstens 50 Prozent darunter zwei Personen sind, die am selben Tag Geburtstag haben? Die Antwort: Die Gruppe muss aus 23 Personen bestehen.

Dann wird diese Herleitung angeboten: Die Wahrscheinlichkeit, dass sich in einer Gruppe (wenigstens) eine Person befindet, die an einem bestimmten Tag Geburtstag feiert, steigt mit der Gruppengröße; bei 253 Personen beträgt diese Wahrscheinlichkeit 50%, vorausgesetzt, die Geburtstage der Leute verteilen sich gleichmäßig über das Jahr von 365 Tagen.

Besteht eine Gruppe aus 23 Personen, dann ergibt das 23·22/2 = 253 mögliche Paarungen. Es gibt also ebenfalls 253 paarweise Vergleiche der Geburtstage von je zwei Partygästen. Folglich muss die Trefferwahrscheinlichkeit (Wahrscheinlichkeit wenigstens einer Übereinstimmung) ebenfalls 50% betragen.

Den errechneten Wert finde ich plausibel. Mir ist nur rätselhaft, was an der Sache paradox sein soll.

Aber Hoppla! Mein Bauchgefühl sagt mir: Mit der Berechnung stimmt etwas nicht. Nur was?

An der ersten Aussage, nämlich dass es 253 Personen braucht, um darunter mit 50-prozentiger Wahrscheinlichkeit eine zu finden, die an einem vorbestimmten Tag Geburtstag hat, ist gewiss nichts auszusetzen, denn: Eine beliebig herausgegriffene Person hat mit der Wahrscheinlichkeit 364/365 nicht diesen Geburtstag. Dass alle 253 Personen nicht diesen Geburtstag haben, hat die Wahrscheinlichkeit (364/365)253 und diese liegt knapp unter 50%. Die Wahrscheinlichkeit für einen Treffer ist das Komplement zu eins dieses Wertes; sie beträgt 50,05%.

Auch die Aussage, dass es in einer Gruppe von 23 Personen 253 verschiedene Paarungen gibt, ist unstrittig. Aber wie steht es mit der Wahrscheinlichkeit, dass wenigstens eines dieser Paare einen gemeinsamen Geburtstag hat? Die Potenzformel setzt voraus, dass die Trefferwahrscheinlichkeiten für alle diese Paare voneinander statistisch unabhängig sind. Und daran hapert es. Die Kandidaten für jede der Paarungen werden ja alle aus derselben Grundgesamtheit von nur 23 Leuten ausgewählt; nur deren Geburtstage stehen zur Debatte. (Bei 366 Personen wäre mit 100-prozentiger Sicherheit ein Paar mit gemeinsamem Geburtstag vorhanden. Die Potenzformel – jetzt mit wahnsinnig großem Exponenten – liefert aber einen Wert unter 100%, zwar sehr geringfügig darunter, aber immerhin.)

Ich habe ein kleines Experiment gemacht und die Trefferwahrscheinlichkeit bei einer Gruppe von 23 Personen mittels stochastischer Simulation ermittelt. Es ergab sich eine Trefferwahrscheinlichkeit  von 50,727% mit einer zweifachen Standardabweichung von ±0,01%. Die Trefferwahrscheinlichkeit liegt also deutlich höher als zunächst berechnet.

Rechnen wir genauer. Vor allem: Wählen wir ein stimmiges Modell! Wir berechnen zunächst die Wahrscheinlichkeit, dass es in der Gruppe von 23 Leuten keinen gemeinsamen Geburtstag gibt.

Wir entnehmen der Gruppe die erste Person. Sie kann mit den bereits entnommenen – da ist keine – keinen gemeinsamen Geburtstag haben. Wir entnehmen der Gruppe die zweite Person. Die hat mit den entnommenen (vorerst nur eine) mit der Wahrscheinlichkeit 364/365 keinen gemeinsamen Geburtstag. Für die nächste sind noch 363 von 365 Tagen übrig. Sie hat mit den bereits entnommenen mit der Wahrscheinlichkeit von 363/365 keinen gemeinsamen Geburtstag. Und so weiter.

Zusammengefasst: Unter der Bedingung dass unter den m bereits entnommenen Personen keine gemeinsamen Geburtstage zu finden sind, beträgt die Wahrscheinlichkeit dafür, dass auch die Person m+1 keinen Treffer bringt, (365-m)/365. Wir errechnen das Produkt all dieser Wahrscheinlichkeiten von m=1 bis m=22.

Dieser Wert ist noch von eins abzuziehen und schon haben wir das Resultat: Die Wahrscheinlichkeit dafür, dass in einer Gruppe von 23 Personen zwei mit gleichem Geburtstag zu finden sind, beträgt 50,7297%. Das passt zum Ergebnis der stochastischen Simulation.

(Ich werde jeden Kommentar schnellstmöglich bearbeiten. Wie in anderen Fällen auch, werde ich notfalls vor der Freischaltung mit den Einsendern per E-Mail diskutieren. Das soll den Diskussionsfaden vor einer Anhäufung von Wirrtümern bewahren und die Redundanz reduzieren. Ich will vermeiden, dass die Unterhaltungsmathematik hier ebenso ungenießbar wird, wie in manch anderem Internetforum.)

KlügerIrrenWerbung in eigener Sache

 

Dieser Beitrag wurde unter Bildungswesen, Problemlösen, Schule und Hochschule, Wahrscheinlichkeitsrechnung abgelegt und mit , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

1 Antwort zu Das Geburtstagsparadoxon

  1. Rathgeber sagt:

    Eine Situation, die oftmals in Schulklassen bzw. auch in Lerngruppen auftritt. So wird zum Beispiel offiziell der Klassendurchschnitt in vielen Bundesländern in Deutschland im Normalbereich (also ohne Förderungen) auf 23 Schülerinnen bzw. Schülern (bzw. Lernende) in öffentlichen Schulen festgelegt. Insofern werden mit den Berechnungen durchaus die Gegebenheiten im alltäglichen Schulalltag abgebildet.

    Nun können gerade durch die Beachtung des Gegenereignisses nicht nur die Geburtstagspaare sondern auch die möglichen Tripel etc. (3er-, 4er-, … Übereinstimmungen und alle (!) entsprechenden Kombinationen) berücksichtigt werden.

    Ein Beispiel: Drei Personen (A, B und C) sollen vorliegen und zehn geeignete Zuordnungen sollen existieren (zum Beispiel die möglichen Tage: 1, 2, …, 10). Für Paare (AB; AC; BC) gibt es in diesem Fall (10 * 1 * 9) * 3 = 270 Möglichkeiten dafür, dass jeweils genau ein Gleichheitspaar auftritt. Das Produkt kommt so zustande: Die erste Person hat zehn Wahlmöglichkeiten. Die zweite nur eine, da ja ein Paar gebildet werden soll. Die dritte Person hat dann 9 freie Möglichkeiten, so dass sie nicht mit den ersten beiden Personen am gleichen Tag zusammen trifft. Da drei unterschiedliche Paarungen möglich sind, ergibt sich noch der Faktor 3.

    Für ein Tripel ergibt sich der Wert: 10 * 1 * 1 = 10 Möglichkeiten.

    Insgesamt existieren 10 * 10 * 10 = 1.000 Möglichkeiten.

    Somit kommen wir auf den folgenden P-Wert: P(mindestens Paare) = (270 + 10) / 1000 = 0,28.

    Rechnen wir mit dem Gegenereignis, wie das auch im Artikel vorgeschlagen wird, dann kommen wir auf folgende Rechnung: P(min. Paare) = 1 – (10 * 9 * 8) / (10 * 10 * 10) = 1 – 720 / 1000 = 0,28.

    Insofern können wir durch die Betrachtung des Gegenereignisses die Vielzahl der gesonderten Übereinstimmungen (Paare, Tripel etc.) elegant auffangen. Mit einzelnen Berechnungsschritten können diese Aspekte bzw. „Effekte“ oftmals nur sehr schwer bestimmt werden.

    Die „Paradoxie“ (als Begriff) bezeichnet (so meine Einschätzung) die Empfindung vieler Schüler, die über den hohen Wert (50 %) verwundert sind. Es entspricht nicht ihrem naiven Vorverständnis. (Die Zahl 23 macht nur etwa 6 % von den möglichen 365 Tagen aus.) Aufgrund ihrer Binnenwahrnehmung schätzen die Schülerinnen und Schüler die Möglichkeit von „Geburtstagpaaren“ in ihren jeweiligen Lerngruppen oftmals deutlich geringer ein. Sehr oft nennen die Schüler Werte von ca. 2 bis 5 % bei 23 Personen.

    In den 1990er Jahren habe ich dies mal empirisch orientiert in Schulen untersucht – mit insgesamt weit über 200 Klassen. Es traten damals Werte von in etwa 60 % auf. D. h., in 60 % der Klassen lag mindestens ein „Geburtstagspaar“ vor.

    Erstaunlich war für mich, dass in etlichen Klassen mehrere Paare und zum Teil natürlich auch Tripel vorlagen. Die Theorie hatte dies exakt vorhergesagt. Die Praxis verhielt sich auch so! Dennoch widersprach der Befund meinem ursprünglichen Erwartung. Genau diese Spannung soll mit dem Wort „Paradox“ eingefangen werden.

    Der erhöhte Wert (60% statt in etwa 50 %) in der tatsächlichen Praxis erklärt sich hauptsächlich über die fehlende Unabhängigkeit bzw. fehlende Gleichverteilung der Geburtstagswerte.

    Die Ergebnisse haben nicht nur damals viele Schüler und auch Lehrer überrascht.
    Aus der Rolle des Schülers (subjektiv-individuelle Wahrnehmung) wird dies als „paradox“ eingestuft. Dem Teilnehmer in einer Lerngruppe fehlt ja oftmals ein entsprechendes Wissen von den Geburtstagsverteilungen in den einzelnen Klassen.

    Mathematisch ist die „Angelegenheit“ definitiv nicht paradox. Die „Paradoxie“ benennt bzw. bezieht sich auf eine Einschätzung der Subjekte, die den Bezug ihrer Wahrnehmungen und Einschätzungen auf ihre jeweiligen Rollen und Einbindungen nicht berücksichtigen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.