Umweltsimulation mit Tabellenkalkulation

Kooperation unter Egoisten: Axelrods Computerturnier

Einführung

Problem: Die Tragödie der Gemeingüter eröffnete düstere Aussichten. Andererseits kennen wir Rücksichtnahme, Fürsorglichkeit und gar aufopferndes Verhalten sowohl in der Tierwelt als auch unter Menschen. Wie lässt sich das erklären? Wie können Altruismus - oder wenigstens kooperatives Verhalten - allein auf der Basis der Evolutionsmechanismen entstehen? Der orthodoxe Darwinist erklärt die Entstehung uneigennützigen Verhaltens mit der Verwandtschaftsselektion oder der Reziprozität:

1.         Altruismus gegenüber Verwandten erhöht die Gesamtfitness des gemeinsamen Genbestands.

2.         Altruismus auf Gegenseitigkeit nach dem Motto 'Hilfst du mir, helf ich dir' erhöht die Individualfitness und ist folglich doch recht eigennützig.

Altruismus auf Gegenseitigkeit kann auf Verträgen basieren. Solche Verträge sind Gegenstand der kulturellen Evolution. Verträge sind grundsätzlich durch Verrat gefährdet. Geht es auch ohne Vertrag und Sanktionsmechanismen?

Ziel: Beantwortung der Frage, ob und wie kooperatives Verhalten auch ohne Verträge und Sanktionsmechanismen entstehen und sich behaupten kann.

Methode: Modellierung der Interaktion von Individuen auf Basis des Gefangenen-Dilemmas. Simulation des Selektionsprozesses: Je besser eine Strategie ist, desto stärker wächst ihr Anteil (ökologische Simulation).

Das Gefangenen-Dilemma und Strategien

Die möglichen Aktionen eines Individuums einer vorgegebenen Population mit einem anderen Individuum seien Kooperation oder Defektion (Betrug, Treubruch). Die Nutzen-Matrix (auch: Auszahlungs- oder Spielmatrix) gibt den Nutzen einer gewählten Aktion in Abhängigkeit von der Aktion des Gegenübers an. Für das Gefangenen-Dilemma wählen wir folgende Auszahlungsmatrix

 

 

Aktion Gegenüber

 

 

K

D

Nutzen

der Aktion

K

2

-1

D

4

0

Die Individuen haben keine Möglichkeit, ihre Aktion von der des Gegenübers abhängig zu machen. Sie kennen aber die Geschichte: Sie wissen, wie sich das Gegenüber in der Vergangenheit verhalten hat. Eine Strategie (mit Gedächtnis) legt die Wahrscheinlichkeit für Kooperation in Abhängigkeit von der bisherigen Erfahrung mit dem Gegenüber fest.

Eine Strategie könnte beispielsweise sein, grundsätzlich zu betrügen (Wahrscheinlichkeit der Kooperation gleich null, unabhängig von der Vorgeschichte), eine andere, grundsätzlich zu kooperieren (Wahrscheinlichkeit der Kooperation gleich eins, unabhängig von der Vorgeschichte). Das sind die sogenannen reinen Strategien.

Der Kooperierende macht beim Zusammentreffen mit ebenfalls kooperierenden Individuen jeweils einen Gewinn von zwei Punkten, beim Zusammentreffen mit Betrügern verliert er jedesmal einen Punkt. Die Betrüger machen untereinander weder Gewinn noch Verlust. Trifft ein Betrüger auf ein kooperierendes Individuum, streicht er vier Punkte ein.

Die hier untersuchten Strategien sind in der folgenden Tabelle zusammengestellt. Als freundlich gilt eine Strategie, die mit Kooperation startet; vergeltend ist sie, wenn sie Betrug der anderen Seite durch Betrug ahndet. Eine Strategie gilt als nachsichtig oder versöhnlich, wenn der Gegner bei Rückkehr zur Kooperation nicht länger durch Betrug bestraft wird.

iK

Immer kooperieren. Die Strategie ist freundlich, nicht vergeltend und versöhnlich.

TfT

Tit for Tat (Wie du mir, so ich dir). Jede Aktion des Gegenübers wird beim nächsten Zusammentreffen mit derselben Aktion beantwortet. Angefangen wird mit Kooperation. Es handelt sich also um eine freundliche, vergeltende und versöhnliche Strategie.

hB

Hinterlistiger Betrüger. Das direkte Gegenteil der  von Tit for Tat: Die Strategie beantwortet jede Aktion des Gegners beim nächsten Zusammentreffen mit der dieser entgegengesetzten Aktion. Die Strategie ist nicht freundlich (sie startet mit Betrug) und nicht vergeltend.

iV

Immerwährende Vergeltung. Freundliche Strategie, die eine Defektion des Gegners mit fortdauernder Defektion beantwortet.

iB

Immer betrügen (immer D).

Zufall

Mit jeweils der Wahrscheinlichkeit ½ wird kooperiert oder defektiert, unabhängig von der Vorgeschichte.

Pawlow

Eine freundliche Strategie. Der Stratege handelt nach folgendem Grundsatz: Kooperiere bei Belohnung oder Bestrafung - sonst nicht. Auch so: Kooperiere bei Übereinstimmung, defektiere bei Abweichung. Oder auch: win-stay, lose-shift.

Simulation des Selektionsprozesses (ökologische Analyse)

Simuliert wird der folgende Selektionsprozess: Ausgegangen wird von einen bestimmten Verteilung der verschiedenen Strategien in einer Population. Die Strategen machen in dieser Mischpopulation beim paarweisen Zusammentreffen Gewinn (oder auch Verlust) - jeweils in Abhängigkeit vom Gegenüber. Die bei rein zufälliger Auswahl des Gegenübers zu erwartende Auszahlung legt die Zuwachsrate der Strategie innerhalb der Population fest. Es bildet sich eine Folge von Generationen heraus, in denen die Tüchtigeren immer größere Anteile einnehmen.

Wir gehen davon aus, dass der Prozess schon eine Weile läuft. Uns interessieren also die Anfangseffekte nicht. Wir können dann eine Nutzen- bzw. Auszahlungsmatrix für Strategien aufstellen. Sie erfasst für jede Strategie den mittleren Nutzen eines jeden Zuges in Abhängigkeit von der Strategie des Gegenübers.

Die Auszahlungsmatrix für die Strategien

Die Auszahlungsmatrix für die Strategien wird spaltenorientiert geschrieben. Der Nutzen einer Strategie ergibt sich also aus den Werten der jeweiligen Spalte. Diese Schreibweise ist für die Erstellung des Arbeitsblattes geeigneter als die zeilenorientierte Form: Es ergibt sich ein besonders gleichförmiges Arbeitsblatt.

 

 

iK

TfT

hB

iV

iB

Zufall

Pawlow

iK

2

2

4

2

4

3

2

TfT

2

2

1,25

2

0

1,25

2

hB

-1

1,25

1

4

4

1,25

0,33

iV

2

2

-1

2

0

-0,5

2

iB

-1

0

-1

0

0

-0,5

-0,5

Zufall

0,5

1,25

1,25

2

2

1,25

1,25

Pawlow

2

2

2

2

2

1,25

2

Spaltensumme

6,5

10,50

7,50

14

12

7,00

9,08

 

Die Herleitung der Werte der Auszahlungsmatrix wird exemplarisch für den komplizierten Fall vorgeführt, dass die Strategien TfT und Zufall aufeinander treffen.

Für einen bestimmten Spielzug ist die Gewinnerwartung von TfT und Zufall zu bestimmen. Da TfT ein Gedächtnis von einem Zug hat, ist auch der vorhergehende Spielzug mit einzubeziehen. Bei der Strategie Zufall sind alle vier Zugpaare gleich wahrscheinlich: KK, KD, DK, DD. Der erste Zug von TfT ist unerheblich. Jedenfalls spielt TfT im zweiten Zug K in den Fällen KK und KD, und D in den Fällen DK und DD.

Das führt zu folgenden Auszahlungen:

Zugfolge Zufall

KK

KD

DK

DD

Zug TfT

?K

?K

?D

?D

Auszahlung für Zufall

2

4

-1

0

Auszahlung für TfT

2

-1

4

0

Es ergibt sich für beide derselbe Mittelwert von (2+4-1)/4 = 1.25.

Eine qualitative ökologische Analyse

Die Spaltensumme in der obigen Auszahlungsmatrix zeigt, dass in einer Population, in der zu Beginn alle Strategien gleich stark vertreten sind, die iV- und iB-Anteile wachsen. Am schlechtesten schneidet die Strategie iK ab – ihr Anteil wird geringer. Dementsprechend trägt dann die Strategien iV mehr zum „Einkommen“ der anderen bei. Der Einfluss der Strategie iK schwindet. Das trifft vor allem die Strategien hB, iB und Zufall. Sie sind letztlich die Verlierer des Spiels, obwohl die Strategie iB durchaus Anfangserfolge hat. Aber die Strategie  iB zerstört ihre Existenzgrundlage. Die kooperativen Strategien bleiben übrig. Der anfängliche Verlierer iK kann sich in der ihm wohlgesinnten Umgebung gut behaupten. Durch Streichung von Strategien (Anfangsanteil = 0) kommt man zu einfacheren und übersichtlicheren Versionen der Simulation.

Übungen, Simulationsprogramme, Anregungen zur Diskussion

1. Kooperationsspiel. Fünf Teilnehmern spielen nach dem Muster von „Papier-Schere-Stein“. Es gibt nur zwei Möglichkeiten: Kooperieren = offene Hand, Defektieren = Faust. Der Gewinn ergibt sich aus der Nutzenmatrix des Gefangenen-Dilemmas. In jeder Runde spielt jeder gegen jeden. Schließlich wird für jeden der Spieler sein Gesamtgewinn ermittelt.

2. Ökologische Simulation. Erstellen Sie ein Tabellenkalkulationsblatt zur Simulation der Dynamik des Selektionsprozesses mittels Ökologischer Simulation. Eine einfache (rein diskrete) Variante dieser Simulationsmethode ist im Arbeitsblatt Ego.xls verwendet worden. Führen Sie Simulationsexperimente durch.

3. Simulation der Evolution.  In der ökologischen Analyse erfolgreiche Strategien haben erhebliche Startschwierigkeiten im Evolutionsprozess. In einer Umgebung aus Betrügern können sich die – in der ökologischen Analyse überaus erfolgreichen – freundlichen Strategien nicht etablieren. Die Freundlichkeit wird zum Verhängnis, weil zunächst zu wenige Partner da sind, die diese erwidern. Das war wohl auch der Grund dafür, dass seinerzeit eine von mir programmierte mikroskopische Simulation der Evolution gescheitert ist (1989, objektorientiertes Turbo-Pascal-Programm). Inzwischen ist das Problem gelöst (Punkte 5 und 6).

4. Irreduzible Komplexität? Aufgrund der eben beschriebenen Startschwierigkeiten scheinen wir vor einem Problem irreduzibler Komplexität zu stehen: Es ist (momentan) kein Evolutionspfad sichtbar, der in kleinen – jeweils die Fitness steigernden – Schritten dorthin hätte führen können.

Genau das ist der Einwand der Kreationisten und der Protagonisten des intelligenten Designs gegen den Darwinismus. Sie weisen auf  Sprünge in der (bislang bekannten) Entwicklung hin, die es nach Darwin nicht geben dürfte. Vorgebracht wird das Beispiel des Flagellums, einer rotierenden Geißel, die gewissen Urtierchen zur Fortbewegung dient. „Ein nicht rotierender Motor ist ein Verlustgeschäft“, so Hermann Schneider, Heidelberg anlässlich der Ringvorlesung „Evolution und Schöpfung“ der Theologischen Fakultät, Fulda am 14.11.89. Darauf hat H. D. Mutschler, Frankfurt/M. in seinem Vortrag die Antwort: „Gott ist nicht nur in den Lücken unserer Erkenntnis“.

Diese Debatte wird auch in John Updikes Roman „Roger´s Version“ (1986) geführt: „For example, to make the lens, skin somehow got inside the meningeal coats of the brain. How could that have happened halfway? In all these things, there are these halfway stages where the adaptation wouldn´t work at all and would be a pure handicap“ (Dale Kohler in Abschnitt II i). Der Theologie-Professor Roger Lambert vertritt die Gegenposition und meint ironisch: „God obligingly is going to rush into any vacuum, any gap of knowledge.“

Evolutionskritik aus der Sicht des intelligenten Designs kommt von William A. Dembski (2003). Kräftig dagegen hält Thomas Waschke (2003). Relativ locker wird die Sache derzeit von den Amtskirchen gesehen. In der Botschaft „Christliches Menschenbild und moderne Evolutionstheorien“ an die Mitglieder der Päpstlichen Akademie der Wissenschaften (22.10.1996) stellt Papst Johannes Paul II heraus: „Die empirischen Wissenschaften beschreiben und messen mit immer größerer Genauigkeit die vielfältigen Ausdrucksformen des Lebens und schreiben sie auf der Zeitachse fest. Der Moment des Übergangs ins Geistige ist nicht Gegenstand einer solchen Beobachtung…“ – Warten wir mal ab, was die Gehirnforscher dazu noch zu sagen haben. Ich denke da vor allem an den Abschnitt „God and the Limbic System“ aus dem Buch „Phantoms in the Brain“ von Vilayanur S. Ramachandran und Sandra Blakeslee (1998).

5. Bedingungen der Evolution: Die oben benannten Anfangsschwierigkeiten der Evolution führen zur Frage: Wie kommt das Neue in die Welt? Die Analyse der Evolution kooperativen Verhaltens erfordert die Einführung weiterer Rahmenbedingungen der Evolution: Isolationsmechanismen und Territorialität (territoriale Analyse). Damit lässt sich das Eindringen von Gruppen in Populationen mit kollektiv bzw. evolutionär stabilen Strategien erklären. Wichtig werden dann das Erkennen von Gruppenmitgliedern und der Gruppenzusammenhalt (Eibl-Eibesfeldt, 1984).

Einsichten bieten die Theorien von der Entstehung des modernen Menschen: Trennung von Biotopen durch tektonische Veränderungen können Evolutionsschübe zur Folge haben (Coppens, 1994). Bedingungen für Innovationen in der Wirtschaft zeigt das Buch von v. Pierer/v. Oetinger (1997) auf: Geschützte Freiräume begünstigen das Entstehen von Innovationen (Beispiel: SAP).

Eine empfehlenswerte Lektüre zur Schulung des Produktiven Denkens und der Fähigkeit, neue Lösungen zu finden, ist der Klassiker von Pólya (1949). Ein weiterer Weg, Denkfallen zu umgehen und Denkgewohnheiten aufzubrechen, ist das Studium derselben (Grams, 1990). Auch hier geht es letztlich darum, Freiräume zu schaffen.

„Die Entwürfe einer multikulturellen Gesellschaft ... sind geeignet, die kulturelle Substanz ... in Frage zu stellen ... Sie sind damit kein Weg zur inneren Befriedung möglicher Nationalitätenkonflikte, sondern gefährden genau die geistigen Kräfte, die zum Zusammenhalt des Landes beitragen können und von denen die Integration ausländischer Zuwanderer ausgehen kann“ (Kurt Biedenkopf, Spiegel 23/1995, S. 17).

6. Die Bedeutung der räumlichen Verteilung. Die mikroskopische Simulation der Evolution stößt dann auf Schwierigkeiten, wenn alle Individuen der Modellwelt gleichberechtigt und undifferenziert gegeneinander konkurrieren. Die Neuen sind zu gering an Zahl, als dass sie einander von Nutzen sein könnten. Und die anderen sind ihnen eher feindlich gesinnt. Die Neuen haben eine Chance, wenn sie sich in einer Nische zunächst ungestört entwickeln können. Danach kann die Gruppe der Neuen mit einiger Aussicht auf Erfolg auch gegen andere konkurrieren. Die von Darwin auf dem Galápagos-Archipel beobachtete Artenvielfalt ist nach heutiger Auffassung auch auf die Aufgliederung des Lebensraums zurückzuführen (Hösle/Illies, 2005). Der Archipel besteht aus 30 Inseln.

Bei Berücksichtigung der räumlichen Verteilung der Individuen und bei Beschränkung der Interaktionen auf Nachbarn gelingt auch in der mikroskopischen Simulation der Nachweis einer Evolution kooperativen Verhaltens. Das habe ich im Rahmen eines kleinen  Java-Projekts  durchgeführt (KoopEgo). Sie können sich gern die Dokumentation oder auch das Java-Archiv sämtlicher Dateien des Projekts einschließlich der BlueJ-Projektdateien herunterladen. Falls Sie das tun, bitte ich um Rückmeldung per E-Mail. Besonders freuen würde ich mich über die Mitteilung von Erfahrungen, die Sie beim Experimentieren mit dem Programm gewinnen, und über Verbesserungsvorschläge, was das Programm selbst betrifft.

7. Leicht gestörte Strategien: Nun betrachten wir den Fall, dass es zu sporadischen Irrtümern bei den Interaktionen kommt (Nowak, May, Sigmund, 1995). Die Auszahlungsmatrix ist für diesen Fall neu zu berechnen. Nehmen wir uns das Paar iK und Pawlow vor: Es beginnt damit, dass beide immer kooperieren, mit dem beiderseitigen Gewinn von 2 Punkten. Aber irgendwann kommt es bei einem zur Defektion. Das führt dazu, dass in den folgenden Schritten Pawlow ständig defektiert und iK ständig kooperiert, wobei Pawlow 4 und und iK -1 Punkte erhält. Mittelwertbildung ergibt einen Wert von 3 für Pawlow und ½ für iK.

Literaturhinweise

Axelrod, R.: Die Evolution der Kooperation. Oldenbourg, München, Wien 1987. Das Hauptwerk auf dem Gebiet

Coppens, Y.: Geotektonik, Klima und der Ursprung des Menschen. Spektrum der Wissenschaft (1994) 12, 64-71

Dawkins, R.: Das egoistische Gen. Springer-Verlag, Berlin, Heidelberg 1978. Orthodoxer Darwinismus populärwissenschaftlich dargestellt.

Delahaye, J.P.; Mathieu, P.: Altruismus mit Kündigungsmöglichkeit. Mathematische Unterhaltung. Spektrum der Wissenschaft (1998) 2, 8-14. Siehe auch http://www.lifl.fr/~ mathieu/ipd.

Dembski, W. A.: Science and Design. Professorenforum-Journal 4 (2003) 2, 3-10 (frei verfügbar über das Professorenforum)

Dembski, W. A.: The Logical Underpinnings of Intelligent Design. Professorenforum-Journal 4 (2003) 2, 11-22 (frei verfügbar über das Professorenforum)

Douglas, M.: How Institutions Think. Syracuse University Press, New York 1986. Behandelt die Rolle der Institutionen bei der Herausbildung und Bewahrung eines „Öffentlichen Gutes“

Eibl-Eibesfeldt, I.: Die Biologie des menschlichen Verhaltens. Piper, München 1984

Glance, N. S.; Huberman, B. A.: Das Schmarotzer-Dilemma. Spektrum d. Wiss. (1994) 5, 36-41.

Grams, T.: Denkfallen und Programmierfehler. Springer, Heidelberg 1990

Hofstadter, D. R.: Metamagikum: Kann sich in einer Welt voller Egoisten kooperatives Verhalten entwickeln? Spektrum d. Wiss. (1983) 8, 8-14. Leichtverständliche Kurzfassung der Originalarbeit von Axelrod

Hösle, V.; Illies, C.: DARWIN. Buchners Verlag, Bamberg 2005. Eine elegante und knappe Einführung in Darwins Werk und Denken. Die Bedeutung der geographischen Isolation für die Entstehung neuer Arten wird auf S. 55 angesprochen.

Nowak, M. A.; May, R. M.; Sigmund, K.: Das Einmaleins des Miteinander. Spektrum d. Wiss. (1995) 8, 46-53. Hier wird die Strategie Pawlow eingehend studiert. Insbesondere wird der Fall untersucht, dass anstelle der deterministischen Strategien mit Kooperationswahrscheinlichkeiten 0 oder 1 leicht gestörte Strategien mit Kooperationswahrscheinlichkeiten nahe 0 und nahe 1 treten

Pierer, H. v.; Oetinger, B. v.: Wie kommt das Neue in die Welt? Hanser, München, Wien 1997

Pólya, G.: Schule des Denkens. Francke, Bern 1949

Ramachandran, Vilayanur; Blakeslee, Sandra: Phantoms in the Brain. HarperCollins, New York 1998

Sigmund, K.; Fehr, E.; Nowak, M. A.: Teilen und Helfen - Ursprünge sozialen Verhaltens. Spektr. d. Wiss. (2002) 3, 52-59. Ultimatum- und Gemeinwohl-Spiele zeigen, wie sich der Sinn für Fairness und Solidarität in Gruppen durchsetzen kann.

Waal, Frans B. M. de: Tierische Geschäfte. Spektrum d. Wiss. (2006) 6, 50-58. „Betreibt also ein Affe oder sonst ein soziales Tier eine ‚innere Buchführung’, sodass er – wie ein Mensch – stets weiß, wie viel er jedem seiner Genossen schuldig ist und umgekehrt? Wohl kaum. Es genügt, wenn er seine soziale Welt in bevorzugte ‚Freunde’ und wenig beachtete ‚Nichtfreunde’ aufteilt… Die ökonomische Verhaltensforschung (geht) davon aus, dass die Evolution Emotionen hervorgebracht hat, die den Gemeinschaftssinn fördern und bewahren.“

Waschke, T.: Intelligent Design – Eine Alternative zur naturalistischen Wissenschaft? Skeptiker (2003) 4 (frei verfügbar über die Gesellschaft zur wissenschaftlichen Untersuchung von Parawissenschaften)

Zurück zur Gliederung

 

© Timm Grams, 26.10.99 (letzte Änderung: 16.03.2007)