Einführung in die Spieltheorie

    • MyLady17
      MyLady17
      Black
      Dabei seit: 11.03.2007 Beiträge: 7.975
      Spieltheorie ist ein Teilgebiet der Mathematik, mit dessen Hilfe versucht wird, Spiele strategisch zu lösen. Ein Spiel wird als solches angesehen, wenn eine Menge an Spielern aus einer gegebenen Menge an Handlungsalternativen wählen kann. Als einführendes Beispiel soll dabei das Spiel „Schere-Stein-Papier“ dienen. Hier gibt es zwei Spieler, die aus den drei Möglichkeiten (Schere, Stein, Papier) wählen müssen. Schere gewinnt dabei gegen Papier, Papier gegen Stein und Stein gegen Schere. Abhängig von der Entscheidung des Gegenspielers gewinnt Spieler 1 (+1), verliert (-1) oder spielt unentschieden (0). Dargestellt wird diese Form von Spielen meist in Matrizenform.



      Uploaded with ImageShack.us

      Die Spieler verfolgen dabei immer eine Strategie. Unterschieden dabei werden kann zwischen der exploitiven und maximalen Spielweise. Grundsätzlich empfiehlt es sich in Spielen (selbstverständlich auch Poker) eine maximale Spielweise zu verfolgen. Gegen schlechte Spieler kann dadurch ein deutlich höherer Gewinn erzielt werden als mit einer optimalen Spielweise. Als Beispiel soll dazu eine Analogie aus der Fernsehserie „Simpsons“ dienen, in der Bart Simpson bei dem Spiel „Schere-Stein-Papier“ auf den „guten alten Stein“ vertraut. Lisa kontert diese Strategie damit, indem sie aus den drei Alternativen natürlich „Papier“ wählt. „Papier“ ist so lange der Spielzug mit dem höchsten Erwartungswert, so lange Bart nicht erkennt, dass er exploited wird. Bekommt er dies mit, wird er aus den Handlungsalternativen „Schere“ wählen. Dies ist im Grunde genommen ein „Katz- und Maus-Spiel“. Eine exploitive Spielweise eröffnet dem Gegenspieler also immer den Spielraum für einen Exploit seinerseits. Dies soll folgendes Diagramm nochmals verdeutlichen.



      Uploaded with ImageShack.us

      Kennt man die Schwächen eines Gegners nicht, empfiehlt es sich auf die optimale Spielweise zurückzugreifen. Hierbei geht es darum, dem Gegenspieler möglichst keine Angriffsfläche zu bieten. Für das „Schere-Stein-Papier“ Spiel ist für Spieler 1 die optimale Spielweise die Strategiekombination 1/3 Schere, 1/3 Stein, 1/3 Papier. Egal was Spieler 2 nun nimmt, seine Wahl hat einen Erwartungswert von 0. Doch was hilft das Ganze nun im Fixed Limit Holdém?

      Die Einführung mit dem einfachen „Stein-Schere-Papier“ Spiel wurde deshalb gewählt, weil Poker an sich zu komplex für eine spieltheoretische Lösung ist. Spieltheoretische Probleme lassen sich bei den meisten Spielen nur dadurch lösen, indem ihnen einen Teil ihrer Komplexität genommen wird und dadurch folglich berechenbare Problemstellungen erreicht werden. Für Poker hat sich der sog. „Half-Street-Ansatz“ als approximative Lösung bewährt.

      Half-Street Spiele laufen wie folgt ab:
      -Spieler 1 (X) checkt
      -Spieler 2 (Y) kann checken oder betten

      Bettet Spieler A, kann Spieler B callen oder folden (jedoch nicht raisen). Checkt Spieler A, kommt es zu einem Showdown. Auch hier lässt sich analog zum Spiel „Schere-Stein-Papier“ eine Auszahlungsmatrix erstellen.



      Uploaded with ImageShack.us

      Hierbei stehen erneut ebenfalls ein exploitiver oder ein optimaler Ansatz zur Wahl. Spieler 1 wird seine Valuehände immer betten, da er ja niemals verliert, wenn Spieler 2 callt. Folded Spieler 2 immer auf die Bets von Spieler 1, wird Spieler 1 seine Bluffs auch immer betten. Bemerkt dies Spieler 2, wird er auf keine Bet mehr folden. Doch wie sollten die Spieler vorgehen, wenn sie die Schwächen ihrer Gegenspieler nicht kennen? Hierzu wird wieder eine spieltheoretisch optimale Lösung verwendet. Im Gegensatz zum „Schere-Stein-Papier“ Beispiel gewinnt Spieler 1 mit einem erfolgreichen Bluff den gesamten Pot, den er sonst verloren hätte. Daher spielt diese Variable eine wesentliche Rolle bei der Suche nach einer optimalen Strategie.

      Verfolgt Spieler 2 eine optimale Strategie, so muss er seine Strategie so wählen, dass sich bezüglich des Erwartungswertes für Spieler 1 egal ist, ob er seine hoffnungslosen Hände aufgibt oder blufft. Blufft Spieler 1 erfolgreich, so gewinnt er den ganzen Pot P und verliert eine Bet, wenn Spieler 2 erfolgreich einen Bluff catcht. Daraus lässt sich folgende Formel konstruieren:

      P(1-c)=c → c=P/(P+1)

      wobei: c= Spieler 2 callt und 1-c = Spieler 2 folded
      Eine optimale Strategie für Spieler 2 wäre also in P/(P+1) der Fälle auf eine Bet zu callen. Spieler 1 wäre bei dieser Frequenz nicht in der Lage, Spieler 2 zu exploiten.

      Analog zur optimalen Calling-Frequenz lässt sich auch eine optimale Bluffing-Frequenz von Spieler 1 berechnen. Spieler 2 gewinnt P+1 beim catchen eines Bluffs und verliert eine Bet gegen die Valuerange von Spieler 1. Daraus lässt sich nun folgende Formel konstruieren:

      1= (P+1)b -> b= 1/(P+1)
      wobei b= Blufffrequenz

      Anhand dieser Formel lässt sich erkennen, dass man in größeren Pötten weniger bluffen sollte und weniger Anteile der eigenen Bluffcatcher folden. Dies ergibt sich bereits in dem recht einfachen Konzept der "Pot Odds"

      - Auszug aus "Analytical Fixed Limit Holdém - Winnings in tough games 2012"
  • 13 Antworten
    • Pulow
      Pulow
      Bronze
      Dabei seit: 21.10.2006 Beiträge: 726
      Original von MyLady17

      Eine optimale Strategie für Spieler 2 wäre also in P/(P+1) der Fälle auf eine Bet zu folden.
      habs nur kurz überflogen .. aber da ist nen tippfehler. muss "callen" statt folden heißen
    • MyLady17
      MyLady17
      Black
      Dabei seit: 11.03.2007 Beiträge: 7.975
      danke
    • bluffem
      bluffem
      Bronze
      Dabei seit: 14.03.2007 Beiträge: 3.786
      Danke für deine Mühe Mylady :)

      Werde mir diesen und den anderen Thread mal ganz in Ruhe durchlesen.
    • pokerr4b3
      pokerr4b3
      Bronze
      Dabei seit: 07.06.2007 Beiträge: 1.956
      Hui,

      jetzt gehts aber echt ab :)

      Erstmal ganz am Anfang:
      Nur zu den Begrifflichkeiten ist optimal = maximal? Würds auf jedenfall einheitlich verwenden, weil du später nichtmehr von maximal vs exploitive sondern von optimal vs exploitive redest.

      Zum Verständnis:
      Verfolgt Spieler 2 eine optimale Strategie, so muss er seine Strategie so wählen, dass sich bezüglich des Erwartungswertes für Spieler 1 egal ist, ob er seine hoffnungslosen Hände aufgibt oder blufft. Blufft Spieler 1 erfolgreich, so gewinnt er den ganzen Pot P und verliert eine Bet, wenn Spieler 2 erfolgreich einen Bluff catcht. Daraus lässt sich folgende Formel konstruieren: P(1-c)=c → c=P/(P+1)


      Also an dieser Stelle (der letzten Entscheidung des Spiels) würde ich sagen, dass Spieler 2 nur seinen Erwartungswert maximiert. Er macht Annahmen über die Auszahlungen und entscheidet. Spieler 1 ist ihm erstmal egal.

      Spieler 1 macht jetzt die z.B. Annahme, dass Spieler 2 ein Gewinnmaximierer ist und weiß daher, wie Spieler 2 handeln würde. Das ist die Rückwärtsinduktion. An dieser Stelle maximiert Spieler 1 jetzt gegeben der Maximierung von Spieler 2.

      a) Die Maximierung ist identisch mit dem was er eh gespielt hätte. -> Gleichgewicht.

      b) Die Maximierung weicht ab. Spieler 1 verändert sein verhalten. Spieler 2 stellt sich drauf ein und führt eine neue Maximierung durch.

      -> Schleife bis zum Gleichgewicht. Im Gleichgewicht spielt jeder dann die gegenseitig beste Antwort. Es gibt keinen Anreiz mehr abzuweichen.

      Also was ich damit sagen will: Ich glaube keiner lässt sich von dem Kalkül leiten, dass es egal ist, was der andere Spieler macht. Und du wirst nie ohne Annahmen auskommen, um zu einem Ergebnis zu kommen.


      Ahhh, also so hätte ich das Problem gelöst, wie du die Situation beschrieben hast, aber ich sehe gerade du hast Halfstreet-Game anders definiert, als du dann deine Spieler hast spielen lassen?! Also hier könntest du noch was an der Genauigkeit arbeiten ;)

      Also Spieler 1 checkt immer und Spieler 2 kann checken oder betten.

      In diesem Spiel würde Spieler 2 wohl folgende Gedanken machen:
      Kann ich den Gegner exploiten oder nicht? Nein ich habe keine Informationen über den Gegner. Meine Madehands bette ich also immer. Soll ich jetzt bluffen? Ich kann noch den ganzen Pot gewinnen, aber die Gefahr ist da, dass ich meinen Einsatz verliere. Ich vermute, dass wir beide keine Informationen haben die uns helfen und daher wird er so spielen, dass ich keinen Gewinn machen kann.

      Was könnten also seine Gedanken sein?
      Er will nicht rausgeblufft werden, aber er will auch nicht zu oft unsere Madehands ausbezahlen.

      Er wird vermuten, dass wir zu 80% Valuehands und zu 20% Bluffs haben.
      Die Potgröße ist 3.

      Er wird nun mit einer Bet konfrontiert. Gibt es eine Möglichkeit direkt zu sehen, was seine optimale Spielweise ist? Ich sehs noch nicht.

      Fall 1:
      Er bettet 100% seiner Range.
      Wie müssen wir reagieren?
      EV= 0,8*(-1) + 0,2*(3+1) = 0

      Also wenn er alles bettet, dann haben wir einen Erwartungswert von 0 , wenn wir callen.
      Wenn wir folden, dann haben wir ebenfalls einen Erwartunswert von 0 und sind somit indifferent.

      Ok das war zufall, dass direkt die optimale Strategie rauskommt.

      Als Vergleich...

      Fall 2:

      Er bettet seine Valuehands und die Hälfte seiner Bluffs also 90% der Range. Gegen diese Range gewinnt man in 1/9 Fällen und verliert in 8/9 Fällen.
      EV(Call) = 8/9* (-1) + 1/9*(3+1)= -0,44

      Also hätten wir einen Fold. Dies ist allerdings ein Exploit! Denn in 0,1% der Fälle gewinnen wir jetzt den Pot, weil Villain behind checked. Dies hat einen Wert von 0,3.


      Zusammenfassung:

      Fall 1: Die Optimale Strategie ist es zu betten, denn es kann nicht ausgenutzt werden, da alle Alternativen einen EV von 0 haben.

      Fall 2: Man kann das Verhalten ausnutzen in dem man foldet.


      Das war jetzt mein Statement, aber ich gebe zu, dass ich weder sicher bei meinen Schlussfolgerungen bin und das Beispiel auch nicht sehr anschaulich ist.Ich poste trotzdem mal, weil ich gerade keine Zeit habe es zu verbessern.
    • wuerstchenwilli
      wuerstchenwilli
      Black
      Dabei seit: 07.04.2008 Beiträge: 18.682
      Tabelle 2 ist nicht ganz richtig imo:

      Spieler 1 macht eine Bluffbet. Spieler 2 foldet, Spieler 1 gewinnt P(ott). Gewinnt er mit der vbet nicht auch den Pott? Nein könnte man sagen, da ihm der Pott ja eh gehört.

      Wo ist denn der Fall des BI?

      Half-Street Spiele laufen wie folgt ab:
      -Spieler 1 (X) checkt
      -Spieler 2 (Y) kann checken oder betten


      Also muss man nicht auch vbet Spieler 1 "check" Spieler 2 "bet" betrachten?

      Imo sind in der Tabelle zu viele 0;0.
    • MyLady17
      MyLady17
      Black
      Dabei seit: 11.03.2007 Beiträge: 7.975
      Right! Werd mich darum kümmern wenn ich wieder mehr Zeit hab.
    • wuerstchenwilli
      wuerstchenwilli
      Black
      Dabei seit: 07.04.2008 Beiträge: 18.682
      Die müsste doch genau so symmetrisch sein, we die SSP-Tabelle.

      Was hab ich mich über "den guten alten Stein " gefreut. Ist bei uns ein Running Gag!!!
    • Marina74
      Marina74
      Bronze
      Dabei seit: 07.02.2013 Beiträge: 1
      super gut ! =)
    • TobiasNRW
      TobiasNRW
      Bronze
      Dabei seit: 21.09.2006 Beiträge: 22.033
      @MyLady studierst du Mathematik?
    • Steph4n
      Steph4n
      Bronze
      Dabei seit: 25.12.2007 Beiträge: 196
      Werde es mir wenn ich zeit habe auch mal in ruhe anschauen. Klingt aber beim ersten überfliegen schon interessant!
    • MyLady17
      MyLady17
      Black
      Dabei seit: 11.03.2007 Beiträge: 7.975
      Oh gott, nein @Tobias ;)
    • TobiasNRW
      TobiasNRW
      Bronze
      Dabei seit: 21.09.2006 Beiträge: 22.033
      Original von MyLady17
      Oh gott, nein @Tobias ;)
      Na sieht halt etwas so aus, wegem dem ganzen Mathekram :)
    • Falco35
      Falco35
      Bronze
      Dabei seit: 03.06.2010 Beiträge: 12.045
      Dazu hat Ragen vor langer Zeit mal ein Video gepostet. Ist leider in englisch. Wie man in der Übersicht rechts sieht gibts noch ein paar interessante vids.

      http://www.academicearth.org/lectures/introduction-to-game-theory


      Edit:
      Ist aber ein interessantes Themengebiet.