No-Limit: Nash-Gleichgewichte und Bluffing/Calling Frequencies

    • sebsn
      sebsn
      Bronze
      Dabei seit: 06.04.2005 Beiträge: 384
      Ein zentraler Begriff der Spieltheorie ist das so genannte Nash-Gleichgewicht, das einen Zustand beschreibt, in dem ein strategisches Gleichgewicht zwischen den Spielern herrscht, sie wechselseitig immer die beste Antwort auf eine Aktion des Gegners parat haben und niemand seinen Profit vergrößern kann, wenn er nur einseitig von seiner Strategie abweicht.

      Euer Feedback bitte hier rein! :)
  • 19 Antworten
    • Tillerman123
      Tillerman123
      Platin
      Dabei seit: 20.03.2005 Beiträge: 844
      glaube könnte da never während des spielens drüber nachdenken ^^ wer hat den geschrieben btw ?
      edit: er ist meiner meinung nach auch viel zu ungenau und kurz gefasst es fehlen viel mehr erläuterungen wie man sowas ins spiel einbauen kann und sowas praktikabel ist, vllt raff ichs auch nur nich aber so hilft mir der artikel kaum.
    • Vinyladdict
      Vinyladdict
      Bronze
      Dabei seit: 28.09.2006 Beiträge: 4.865
      ich kriegs nicht gebacken...muss man da mathematik studiert haben :)

      aber ein toller artikel auch wenn ich nichts verstanden hab
    • brunsonsbro
      brunsonsbro
      Bronze
      Dabei seit: 26.04.2006 Beiträge: 3.693
      Finde den Artikel sehr theoretisch. Da würde mich auch noch über mehr praktische Anwendungen/ Erläuteungen freuen.

      Thematisch fand ich ihn sehr interessant.
    • benjo
      benjo
      Black
      Dabei seit: 15.01.2005 Beiträge: 1.873
      tl;dr

      aber schön zu wissen ,dass es als nicht-mathenerd wohl normal ist nichts zu verstehen ;)
    • Sh1LLa
      Sh1LLa
      Bronze
      Dabei seit: 14.08.2006 Beiträge: 7.591
      hm, mal lesen :)
    • atuerke
      atuerke
      Bronze
      Dabei seit: 06.04.2005 Beiträge: 4.695
      Kein Wort verstanden, dabei studier ich sogar Mathe ;)
    • praios
      praios
      Black
      Dabei seit: 30.07.2006 Beiträge: 7.355
      Damit Spieler 1 profitabel bluffen kann, muss der Bluff in x*Pot/(x+1)*Pot = x/x+1 der Fälle erfolgreich sein, d.h. Spieler 2 muss in mindestens x/x+1 der Fälle folden.

      welche formel liegt diesen ergebnis zugrunde?
    • MalagaNt
      MalagaNt
      Bronze
      Dabei seit: 10.04.2006 Beiträge: 3.275
      Naja das ist doch logisch: x ist die Bet als Vielfaches des Potts.
      Bettest du PS,d h. x = 1, musst du in 1/1+1=1/2 = 50% der Fälle erfolgreich sein.
      Bettest du 2*PS, d.h. x=2, musst du in 2/2+1 = 2/3 = 66% der Fälle erfolgreich sein.
      ...


      Aber mehr praktische Anwendungen wären sicher sinnvoll.
    • Madzger
      Madzger
      Bronze
      Dabei seit: 16.09.2005 Beiträge: 915
      ich hätte die ergebnisse aus dem zweiten abschnitt wohl auch erläutern können ohne so viel mathematischen hintergrund einzuführen (ich denke, man kann sogar erst beim zweiten abschnitt anfangen zu lesen und wird das meiste verstehen), aber ich denke, der begriff des nash gleichgewichts ist relativ interessant, und man kann etwas besser erkennen, warum man in gewissen situationen eine solche strategie anwenden kann
      außerdem ist so mathematisch auch sofort klar, warum eine solche strategie nicht exploitable ist (man erhält den wert des spiels)

      zur anwendung habe ich ja etwas am ende des zweiten abschnitts geschrieben
      man kann es ein bisschen mit stein, schere, papier vergleichen .. wenn man sich überlegt, was der gegner nehmen könnte oder sich überlegt, was der gegner denkt, was man selbst nehmen könnte usw. und daraufhin eine wahl trifft, kann es immer sein, dass der gegner genau das vorhersieht .. wenn man allerdings völlig zufällig mit einer wahrscheinlichkeit von jeweils 1/3 wählt (dies ist das Nash GG dieses spiels), kann man auf lange sicht nicht verlieren (allerdings auch nicht gewinnen), egal welche strategie der gegner wählt



      @praios: pot odds ... mit einem bluff der grösse x*Pot riskiert man x*Pot, um 1*Pot zu gewinnen => Pot Odds x*Pot : 1* Pot => benötigte erfolgswahrscheinlichkeit x*Pot / x*Pot + 1*Pot

      weitere konkrete fragen werde ich natürlich versuchen zu beantworten
    • Sportbernd
      Sportbernd
      Bronze
      Dabei seit: 18.01.2005 Beiträge: 22.449
      hab mir 1 semester spieltheorie in der uni reingezogen und hat mir 0 fürs pokern gebracht :(
    • leswob
      leswob
      Bronze
      Dabei seit: 01.03.2006 Beiträge: 1
      würde den Artikel auch gerne lesen, weil ich mich in meinem studium recht viel mit der spieltheorie beschäftigen musste! leider darf ich es net! :(
    • Broxwalker
      Broxwalker
      Bronze
      Dabei seit: 21.11.2006 Beiträge: 2.755
      Ich denke die spieltheorie bringt fürs pokern nicht unbedingt den letzten stein der waisen. trotzdem sieht man, denke ich, dass es wichtig ist zu wissen, dass es viele wege zum ziel gibt. hab jetzt nicht so den extremen bock gehabt mich damit auseinander zu setzen aber hab mal im wikipedia bisschen die gedankeexperimente gelesen und einige muster lassen sich schon aufs pokern übertragen z.B. beim Bluffen und dem beautycontest (im punkt du denkst dass ich denke dass du denkst...). ist schon cool aber NL ist halt nicht unbedingt so simpel. Negreanu hat gesagt: Limit is science No Limit is art.
    • hornyy
      hornyy
      Bronze
      Dabei seit: 01.09.2006 Beiträge: 19.868
      Zwar sehr theoretisch, aber superinteressanter Artikel. Danke auch für die Wiki Links auf denen ich mich jetzt seit 2 Stunden rumtreibe ;)
    • Rolo23
      Rolo23
      Bronze
      Dabei seit: 18.04.2005 Beiträge: 743
      so, da ich den artikel nun endlich lesen konnte(bisher nur gold), hier mal ein paar anmerkungen:

      - der Artikel ist in meinen Augen überhaupt nicht zu "mathematisch", das theoretische Konstrukt ist jetzt nicht zu formell dargestellt(hier hätte man in meinen Augen sogar noch klarer vorgehen können, vor allem an der Stelle, wo du schreibst, dass die Auszahlung=pAq, was ist p, was ist q? Unten sieht man dann, dass es Zeilenvektoren sein sollen, dann wäre allerdings korrekt:AUszahlung=p*A*qtransponiert!)

      -das Anwendungsbeispiel finde ich unglücklich gewählt:
      Ich Zitiere:"Spieler 1 weiß, ob er vorne liegt oder nicht, und Spieler 2 weiß auch, dass Spieler 1 das weiß. "
      Ich kann mir Beispiele für den ersten Fall vorstellen. Wenn ich die Nuts habe, weiß ich dass ich vorne liege und wenn ich high card 3 habe, weiß ich dass ich hinten liege. Was ist in Situationen zb mit Top Pair no Kicker? Diese Situation erfüllt offensichtlich nicht die Voraussetzungen. Dh es könnten demnach nur Situationen betrachtet werden, in denen Spieler 1 entweder die Nuts oder Nada hat und laut der Voraussetzung müsste dies auch Spieler 2 bekannt sein.
      Dies ist meiner Ansicht nach eine überhaupt nicht sinnvolle Voraussetzung und ist für das praktische Spiel nicht anwendbar. Auch die Strategiewahl ist finde ich sehr unglücklich modelliert: So bedeutet zb die Strategie(1/3, 2/3): In den Fällen, in denen ich am River bette in Händen, in denen ich weiß, ob ich vorne oder hinten liege (und dem Gegner das bekannt ist), habe ich in jeder dritten Hand nichts. Finde ich sehr unpraktikabel dargestellt..

      -> imO bessere Beispiele:

      - Pushing/Calling-Ranges in Sngs: Annahme zb HU-Situation und beide Spieler <10BB: Spieler A ist first to act und kann pushen oder folden, Spieler B kann daraufhin callen oder folden. Beide Spieler überlegen sich bei ihrer Wahl wieviel % der Hände der Gegner pusht bzw callt und wählen daraufhin die Prozentzahl der Hände mit der sie callen bzw pushen.

      - Eine Betrachtung von Spielweisen, die exploitable sind:
      zb Spieler X minraised mit AA und KK, andere Hände wie AK, AQ raised er auf 4BB
      Spieler Y contibettet <1/2 Pot, wenn er nichts hat und >1/2 pot, wenn er etwas hat

      vllt hätte man auch noch eine kleine Einführung zu Extensivformspielen schreiben können, für einige Beispiele sicherlich sinnvoll..
    • sinisterdexter
      sinisterdexter
      Bronze
      Dabei seit: 03.08.2006 Beiträge: 220
      Hrm, immer darf ich die spannenden Artikel nicht klicken, nur weil ich als Hobbyzocker nicht genügend Punkte produziere... :)

      Aber ich habe mich trotzdem mal ein bißchen mit dem Nash-Equilibrium und sonstigen Poker-Strategien beschäftigt. Drauf gekommen bin ich, weil es ja neulich dieses Turnier zwischen den zwei Pros und dieser Poker-Software gab, bei dem die Pros nur mit Mühe einen hauchdünnen Sieg erringen konnten. Und da stand auch etwas von "basiert auf dem Nash-Equilibrium". Und da wollte ich das mal genau wissen.

      Das schöne am Nash-Equilibrium ist, daß es quasi eine mathematische Modellierung von reverse, reverse-reverse, reverse-reverse-reverse usw. bis ins unendliche ist, und insofern auch Bluffs miterfaßt.

      Die Geschichte hat natürlich in der Praxis ein paar Haken. Zum Beispiel hat schon beim Heads-Up-Limit-Holdem der Spielbaum 10^18 Knoten, die Berechnung des Nash-Equilibriums ist damit schlicht aufgrund mangels ausreichend RAM auf diesem Planeten unmöglich. Das sieht für mehr Player oder gar NL natürlich noch viel schlimmer aus.

      Es gibt mehrere gängige Ansätze, um das Problem in den Griff zu bekommen. Eine ganz grundlegende Idee ist die Darstellung des Spiels nicht in Normalform, sondern in Sequenzform. Das verkleinert die Matrix schon einmal beträchtlich. Weiterhin wird das Spiel zerlegt, und z.B. die optimale Preflop-Strategie vorberechnet, und eine näherungsweise Lösung wird online berechnet, wenn der Flop bekannt ist. Auch andere Teilspiele lassen sich so getrennt betrachten, z.B., wie vermutlich in dem referenzierten Artikel geschehen, die push-or-fold-Entscheidung in einer heads-up-Situation.

      Darüber hinaus wird das Problem des großen Spielbaums durch automatische Abstraktionsfindung angegangen, d.h., ähnliche Situationen mit ähnlichen Erwartungswerten werden zusammengefaßt, wenn der EV-Unterschied unter einem einstellbaren Epsilon liegt. Es gibt dazu eine Reihe von Veröffentlichungen, Google nach "GameShark" zu fragen liefert eine längere Liste lesenswerter Papers.

      Eins darf man bei Equilibrium-Betrachtungen aber nicht vergessen: diese liefern nicht die optimale Spielweise gegen einen bestimmten Gegnertyp, sondern eine konservative Spielweise, gegen die keine Gegenstrategie existiert. Will man mehr herausholen, muß man auf die Schwächen des Gegners eingehen und diese ausnutzen, das vermag eine Nash-Equilibrium-Strategie nicht. Dazu braucht man eine Modellierung mit Hilfe eines Markov-Entscheidungsprozesses, bzw. im Falle von Poker wegen der unvollständigen Information eines teilweise beobachtbaren Markov-Entscheidungsprozesses (MDP bzw. POMDP).
    • Madzger
      Madzger
      Bronze
      Dabei seit: 16.09.2005 Beiträge: 915
      @Rolo23:
      die voraussetzungen für das anwendungsbeispiel sind natürlich sehr streng und werden wohl selten wirklich absolut zutreffen, aber es gibt schon situationen, die ähnlich sind
      das naheliegendste bsp ist wohl, wenn ein spieler flop und turn check/callt auf einem board mit str8 und flush draws und dann auf dem river bettet, nachdem einer der draws ankommt
      man kann die theorie aber natürlich längst nicht bei jeder hand anwenden
      (wie gesagt, man kann sie auch gar nicht anwenden, es ist mehr ein denkanstoss als eine konkrete strategie)

      zur modellierung der strategie: am ende habe ich ja noch geschrieben, dass man noch umrechnen muss, wie oft man mit einer bestimmten hand bluffen muss, um die gewünschte bluffwahrscheinlichkeit zu erreichen
      eine andere darstellung für die strategie fällt mir eigtl nicht ein .. man kann ja nicht einfach, die wahrscheinlichkeit nehmen, mit der man blufft, wenn man nichts hat
    • Madzger
      Madzger
      Bronze
      Dabei seit: 16.09.2005 Beiträge: 915
      @sinisterdexter:
      in dem post sind einige interessante punkte, die ich auch teilweise mehr oder weniger direkt im artikel angesprochen habe
      wie du geschrieben hast ist es wichtig, dass es sich nicht um eine strategie handelt, die schwächen des gegners möglichst gut ausnutzt, sondern um eine, die selbst nicht geschlagen werden kann
      im artikel ging es auch nicht darum, ein nash gleichgewicht für das spiel poker insgesamt zu errechnen, was wie du sagtest rechnerisch zu aufwändig ist, sondern es wurde nur der begriff mathematisch definiert und gezeigt, wie eine strategie für eine entscheidung an einer einzelnen street entwickelt wird
      mit methoden eine strategie für das gesamte spiel zu entwickeln hab ich mich bisher nie beschäftigt .. das ist wahrscheinlich auch ziemlich komplex :)

      da du an solchen themen interesse zu haben scheinst, könntest du dir mal das buch mathematics of poker von chen und ankenman angucken
      ich habe es heute bekommen und es scheint interessant zu sein .. einige teile des buches werden wohl auch zu artikeln verarbeitet werden ;)
    • Siete777
      Siete777
      Black
      Dabei seit: 27.08.2006 Beiträge: 5.687
      Original von Broxwalker
      Ich denke die spieltheorie bringt fürs pokern nicht unbedingt den letzten stein der waisen.
      I lol'ed
    • Rolo23
      Rolo23
      Bronze
      Dabei seit: 18.04.2005 Beiträge: 743
      @madzger:
      alles korrekt was du schreibst, ich habe ja auch nicht geschrieben, dass es falsch ist; sondern dass ich das Modell aufgrund "Realitätsferne" unglücklich gewählt finde

      Original von Madzger
      da du an solchen themen interesse zu haben scheinst, könntest du dir mal das buch mathematics of poker von chen und ankenman angucken
      ich habe es heute bekommen und es scheint interessant zu sein .. einige teile des buches werden wohl auch zu artikeln verarbeitet werden ;)
      meld dich mal bei mir, ICQ #113878660; habe den verdacht, wir haben beide kürzlich ne ähnliche mail bekommen ;)