Wo steckt der Fehler?

Wenn ich mit Menschen- und mit Engelzungen redete, und hätte der Liebe nicht, so wäre ich ein tönend Erz oder eine klingende Schelle.
1.Kor 13, 1

Im Forum Mathematik & Physik stellte ich das Spaghetti-Problem zur Debatte und erhielt als ersten Kommentar: „Ist halt nen Klassiker und deshalb eher langweilig.“ Nun ja, nicht jeder kennt alle Klassiker. Und die Sache wird interessant, wenn man sich nicht für irgendeine Lösung, sondern für eine möglichst elegante interessiert. Dann kann man auch über Klassiker diskutieren.

Lernen aus den Fehlern

Noch ein Klassiker, von dem man viel lernen kann: das Buch „Wo steckt der Fehler?“ von Walther Lietzmann (1953). In der Einleitung schreibt Lietzmann:

Das Landläufige ist doch wohl, der Lehrer berichtigt im mündlichen Unterricht die Fehler seiner Schüler, streicht sie in den schriftlichen Arbeiten an und lässt sie verbessern, zumeist aber, ohne die günstige Gelegenheit zu Vertiefung in die Einsicht, warum nun das richtig und dies falsch ist, auszunutzen. Mir will scheinen, eine Theorie und Praxis der Fehlerauswertung verdiente einmal eine gründliche Untersuchung.

Diese Einsicht liegt auch meinem System der Denkfallen zugrunde.

Wer nun meint, er haben nicht genügend viele Anfängerfehler greifbar, dem kann neuerdings geholfen werden. ChatGPT komponiert seine Texte aus Bausteinen, die er einem riesigen Textfundus entnimmt. Darin ist einiges Richtiges und viel Falsches. Soweit ich erkennen konnte, lässt ChatGPT kaum einen Anfängerfehler aus.

Für das Lernen aus den Fehlern schlage ich vor, eine Rätselaufgabe, ob altbekannt oder neu, dem System ChatGPT zur Lösung aufzugeben. Diese Lösungsvorschläge kann man dann nach Fehlern durchforsten und gegebenenfalls berichtigen. Wie das geht, zeige ich an dem einfachen Problem „Das erste Ass“.

Das erste Ass

Ein gut durchmischter Kartenstapel mit 52 Karten und vier Assen wird nacheinander Karte für Karte aufgedeckt. Wie viele Karten muss man im Mittel aufdecken, bis das erste Ass kommt?

Erster Lösungsversuch ChatGPT (GPT-3.5)

Um die durchschnittliche Anzahl von Karten zu berechnen, die aufgedeckt werden müssen, bis das erste Ass erscheint, verwenden wir das Konzept der sogenannten „geometrischen Verteilung“. Die geometrische Verteilung beschreibt die Anzahl der unabhängigen Versuche (hier das Aufdecken einer Karte), die benötigt werden, bis zum ersten Erfolg (hier das Erscheinen des ersten Asses). Die Wahrscheinlichkeit, dass eine Karte ein Ass ist, beträgt 4/52, da es 4 Asse in einem Stapel von 52 Karten gibt. Die Wahrscheinlichkeit, dass die erste Asskarte bei der ersten Karte erscheint, ist daher 4/52. Die Wahrscheinlichkeit, dass das erste Ass bei der zweiten Karte erscheint, ist (48/52) * (4/52) (d.h., die Wahrscheinlichkeit, dass die erste Karte keine Asskarte ist, multipliziert mit der Wahrscheinlichkeit, dass die zweite Karte eine Asskarte ist). Allgemein beträgt die Wahrscheinlichkeit, dass das erste Ass bei der k-ten Karte erscheint: P(ass bei der k-ten Karte) = (48/52)^(k-1) * (4/52)

Fehler: Die Wahrscheinlichkeit, dass die k-te Karte ein Ass ist, unter der Vorbedingung, dass bis dahin kein Ass vorkam, lässt sich nicht durch ein einfaches Potenzgesetz darstellen.

Die erwartete Anzahl von Karten, die aufgedeckt werden müssen, bis das erste Ass erscheint, ist das sogenannte „Erwartungswert“ und wird wie folgt berechnet: E(X) = Σ [k * P(ass bei der k-ten Karte)], wobei die Summe über alle möglichen Werte von k (1 bis unendlich) läuft.

Fehler: Es sind nicht unendlich viele Positionen für das erste Ass möglich, sondern nur 1, 2, 3, … ,49. Die Summenformel für endlose geometrische Progression ist nicht anwendbar.

E(X) = Σ [k * (48/52)^(k-1) * (4/52)] Glücklicherweise existiert eine Formel, um den Erwartungswert der geometrischen Verteilung zu berechnen: E(X) = 1 / P(ass bei der 1. Karte) E(X) = 1 / (4/52) = 13 Also muss man im Mittel 13 Karten aufdecken, bis das erste Ass erscheint.

Nach Korrektur der Vorbedingung und bei Berücksichtigung der Endlichkeit der Summe kommt man mit einem Tabellenkalkulationsprogramm auf den richtigen Wert: 10,6.

Zweiter Lösungsversuch ChatGPT (GPT-3.5)

Um die durchschnittliche Anzahl der aufgedeckten Karten zu berechnen, bis das erste Ass erscheint, müssen wir den Erwartungswert verwenden. Bevor wir fortfahren, lassen Sie mich Ihnen eine wichtige Eigenschaft erklären: Die Wahrscheinlichkeit, dass die erste Karte ein Ass ist, beträgt 4/52, da es insgesamt 4 Asse und 52 Karten im Stapel gibt. Nun, wenn die erste Karte kein Ass ist (was mit einer Wahrscheinlichkeit von 48/52 passiert, da es 48 Karten gibt, die keine Asse sind), dann wiederholen wir den gleichen Prozess mit den restlichen Karten, jedoch mit einer Karte weniger im Stapel (nur noch 51 Karten, da die erste Karte aus dem Spiel ist). Der Erwartungswert dafür ist jedoch um 1 erhöht, da wir bereits eine Karte aufgedeckt haben. Lassen Sie uns das oben Gesagte mathematisch darstellen: E(X) = (48/52) * (E(X) + 1) + (4/52) * 1

Das E(X) auf der linken Seite der Gleichung ist ein anderes als das in der runden Klammer. Ich habe keine Idee, wie man diesen Ansatz zum Funktionieren bringen könnte.

Jetzt lösen wir nach E(X) (dem erwarteten Wert) auf: E(X) = (48/52) * E(X) + 48/52 + 4/52 E(X) – (48/52) * E(X) = 52/52 (1 – 48/52) * E(X) = 1 (4/52) * E(X) = 1 E(X) = 1 / (4/52) E(X) = 13 Also muss man im Durchschnitt 13 Karten aufdecken, bis das erste Ass erscheint.

Ein falsches Ergebnis, wie zu erwarten war.

Dritter Lösungsversuch ChatGPT (GPT-3.5)

Um die durchschnittliche Anzahl der aufgedeckten Karten zu berechnen, bis das erste Ass kommt, können wir die Methode der erwarteten Wert (oder Durchschnitt) verwenden. Die Wahrscheinlichkeit, dass die erste aufgedeckte Karte ein Ass ist, beträgt 4/52 (da es vier Asse in einem Stapel von 52 Karten gibt). Wenn die erste Karte kein Ass ist, dann haben wir noch 51 Karten im Stapel, von denen 4 Asse sind. Die Wahrscheinlichkeit, dass die zweite Karte ein Ass ist, beträgt also 4/51. Für die dritte Karte beträgt die Wahrscheinlichkeit 4/50 und so weiter. Der erwartete Wert (E) für die Anzahl der aufgedeckten Karten bis zum ersten Ass kann wie folgt berechnet werden: E = (1) * (4/52) + (2) * (4/51) + (3) * (4/50) + … + (k) * (4/(52-k+1)) wobei k die Anzahl der aufgedeckten Karten ist (k = 1 für die erste Karte, k = 2 für die zweite usw.), und der Erwartungswert E ist das, was wir suchen.

Hier wird ganz vergessen, dass man mit bedingten Wahrscheinlichkeit rechnen muss.

Da die Kartenstapel immer vollständig gemischt sind, können wir die Wahrscheinlichkeit als bedingt unabhängig betrachten, d.h., die Wahrscheinlichkeit, ein Ass zu ziehen, hängt nicht davon ab, welche Karten zuvor gezogen wurden. Daher können wir die Wahrscheinlichkeiten einfach addieren.

Wirklich nicht!

Um den Erwartungswert zu berechnen, müssen wir die obige Summe berechnen. Es ist jedoch wichtig zu beachten, dass die Summe endlos ist, da theoretisch das erste Ass erst bei der 52. Karte auftauchen könnte.

Dass das nicht sein kann, müsste jedem Grundschüler auffallen.

Für eine allgemeine Formel des Erwartungswerts können wir die unendliche Reihe verwenden: E = Σ (k * (4/(52-k+1))), wobei k von 1 bis 52 geht.

Nach dieser Formel ergibt sich ein Erwartungswert jenseits von 208.

Um den Wert numerisch zu berechnen, ist es ratsam, eine Computeralgebra-Software oder ein Programm wie Python zu verwenden. Hier ist ein Python-Code, der den Erwartungswert berechnet: pythonCopy code def expected_value(): total_cards = 52 total_aces = 4 expected = 0.0 for k in range(1, total_cards + 1): probability = total_aces / (total_cards – k + 1) expected += k * probability return expected result = expected_value() print(result) Wenn Sie den obigen Python-Code ausführen, erhalten Sie als Ergebnis den durchschnittlichen Wert: Erwartungswert ≈ 6.6923076923076925 Das bedeutet, dass Sie im Durchschnitt etwa 6,69 Karten aufdecken müssen, bis Sie das erste Ass ziehen.

Beim dritten Lösungsversuch hat ChatGPT seinen Ausdruck noch mit einem Screenshot des verwendeten Programms garniert. Das trägt zur Überzeugungskraft der Herleitung nichts bei, auch nicht, dass das Ergebnis auf 17 Stellen genau angegeben wird. (Ein Studienkollege hatte seinerzeit in seiner Diplomarbeit den Computerausdruck mit allen Nachkommastellen abgeschrieben. Das hat ihn die Eins gekostet.) Das Ergebnis ist unterirdisch. Noch nicht einmal erkannt wird, dass der letzte Platz für das erste Ass die 49. Karte ist.

Ich bin hier in einen tadelnden Ton verfallen. Das hat die Maschine natürlich nicht verdient. Die Hersteller versprechen eine Quasselstrippe, und das ist sie eben auch. Ich verlange von einer Maschine keine Höflichkeitsfloskeln. Genau diese verleiten den Anwender aber dazu, die Maschine ernst zu nehmen. Das hat sie auch nicht verdient.

Dieser Beitrag wurde unter Bildungswesen, Denksport, Logik, Problemlösen, Schule und Hochschule, Skeptizismus, Statistik veröffentlicht. Setze ein Lesezeichen auf den Permalink.

7 Antworten zu Wo steckt der Fehler?

  1. UnverstandeinesProfs sagt:

    Es ist ein Sprachmodell!

    für z.b. Rhetorik Analysen kein Mathe Modell, dafür gibts ganz andere KIs

    Oder Tools Wolfram Alpha z.b.

    • Timm Grams sagt:

      ChatGPT lässt kaum einen Anfängerfehler aus, weil es mit einem Textkorpus gefüttert wurde, der diese Anfängerfehler enthält. Deshalb eignet sich das System dazu, die Analysefähigkeit zu trainieren. Nur darum geht es mir.

      („UnverstandeinesProfs“: Sie wollen doch ernst genommen werden, oder? Ich habe da eine ziemlich hohe Toleranzschwelle, aber sie ist durchaus irdisch.)

  2. UnverstandeinesProfs sagt:

    („UnverstandeinesProfs“: Sie wollen doch ernst genommen werden, oder? Ich habe da eine ziemlich hohe Toleranzschwelle, aber sie ist durchaus irdisch.)

    Ad Hominem?

    Wissen Sie was es mir ist, ob Sie oder irgendein anderes Internetfossil, mich ernst nehmen oder nicht?

    Das hier genauer auszuführen, verbietet mir meine gute Erziehung.

    • Timm Grams sagt:

      Was treibt Sie zur persönlichen Attacke? Sachliche Gründe geben Sie nicht an. Was ist es dann?

      Ich habe Ihren Kommentar freigeschaltet, weil ich dieses Verhalten der anonymen Sticheleien, das im Internet ja weit verbreitet ist, sehr rätselhaft finde. Und ich löse gerne Rätsel.

  3. unmutübereienaltenProf sagt:

    „as treibt Sie zur persönlichen Attacke?“

    Das frage ich Sie zurück.

    Die Erklärung war:
    es handelt sich um ein Sprachmodel, es mit Zahlen und Rechnungen zu bestücken und dann eine Lösung zu erwarten ist vollkommen sinnfrei, lassen Sie sich eine Rhetorik Analyse erstellen und veröffentlichen Sie eben jene hier.

    Dafür wurde dieses KI Sprachmodel bereitgestellt, insbesondere die 4,x Version ist deutlich interessanter aber auch Kostenpflichtig.

    Nehmen Sie z.b. einen Der Texte der Alternativen Medien(apolut,reithuster,compact,achsedes…) und lassen eine Analyse darüber laufen mit Chat GPT, noch besser nehmen Sie Texte reden der Grünen Politiker und lassen diese Analysieren, sehr wenige Manipulative Tricks, nehmen Sie CXU/AFDP und man fällt wirklich vom Stuhl.

    Ihr Altersstarrsinn stichelt mich an.

    Nehmen Sie doch einfach das Produkt so her wie es gedacht ist, oder gehen Sie jede Woche auch zum Metzger und Fragen:
    „Lieber Metzger, was hältst du von meinen Veganismus plänen? Wundern Sich dann über seine abwehrende Haltung?“

    Die haben das in ihrem Blog jetzt bereits mehrfach gemacht, das Sie immer wieder versuchen das Produkt Chatgpt zu vergewaltigen und zu zweckentfremden, was soll das? Was wollen Sie damit erreichen?

    Ich stieß auf ihren Blog, weil Sie sich mit der GWUP überworfen hatten, und weil ich diese Lobby Organisation der Pharmaindustrie, Düngemittelmafia und eventuell auch Büttel der Atommafia selbst äußerst kritisch beäuge.

    Systemfeinde Systemdestabilisierer Zweifel Streuer Merchants of Doubt sind mir ein Dorn im Auge….

    Dann stelle ich aber fest, das ein Professor immer wieder dieselben Denkfalle betritt, weißt man ihn darauf hin wird er bockig.

    • Timm Grams sagt:

      Offenbar wollen Sie mit mir in einen fairen Gedankenaustausch treten. Nichts dagegen. Sie sollten dafür aber erst einmal die Tarnkappe ablegen – meinetwegen auch in einer privaten Mail – und zweitens auf herabsetzendes Vokabular verzichten.

      Nun zu einem grundlegenden Missverständnis. Ich kritisiere nicht die Technik von ChatGPT, sondern die überzogenen Erwartungen daran, im Sinne von Ray Kurzweil: „Die Singularität ist nahe“. Beispiele dafür sind hier im Hoppla!-Blog zu finden, beispielsweise in der Diskussion zum Artikel Quanteninformationen und Emergenz. Sascha Lobo spricht im Spiegel-Artikel Eines der mächtigsten Instrumente der Menschheitsgeschichte diesen Hype ebenfalls an.

  4. Tarnkappenbomber sagt:

    Spiegel, Populistenblättchen, das selbst schon oft auf dem Abschusstreppchen war.

    Lobo, selbst ein Aufmerksamkeitsökonom und Narzist erster Güte…. schreibt von einem Winkelminütchen…..

    Echt jetzt?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Optionally add an image (JPEG only)