Mathematics of Poker S. 103

    • humpf
      humpf
      Bronze
      Dabei seit: 29.07.2006 Beiträge: 1.331
      Mathematics tells us that the optimal strategy to a zero-sum two-player game have the following properties:

      1) As long as mixed strategies are allowed (i.e., each player can use strategies such as "do X 60% of the time and Y 40%), optimal strategies always exist.

      2) As a corollary to this, if an optimal strategy contains a mixed strategy, then the expectation of each strategic alternative must be equal against the opponent's optimal strategy. Thus, optimal strategies in poker do not contain "loss leaders" or other plays that sacrifice immediate expectation for deceptive purposes. If a hand is played in different ways, then each way of playing the hand will have the same expectation. Otherwise the player could simply shift all the hands from the option with lower expectation to the option with higher expectation and unilaterally improve.

      Der zweite Punkt ist recht verwirrend, allerdings glaube ich, dass er sehr wichtig ist. Hat irgendjemand Ideen oder eine weiterführende Erklärung. Gedanken von mir folgen.
  • 40 Antworten
    • Sleyde
      Sleyde
      Black
      Dabei seit: 15.01.2005 Beiträge: 17.714
      geht anscheinend darum, dass die optimale strategie sachen wie deception oder image building, die evtl im moment -EV sind, später aber in ihren Auswirkungen ++EV sein könnten, nicht beinhaltet oder wie?


      der erste satz des zweiten teils leuchtet noch ein, glaub ich...wenn es nicht so wäre, dass die expectations equal wäre, dann könnte man ja immer nur die eine strategie benutzen und die andere wäre dann somit garnicht mehr part der optimalen strategie. die nächsten sätze sind oben beschrieben. und im letzten teil nochmal ein finales argument, warum jede strategische alternative der optimalen strategie den selben EV haben muss, weil man sonst, wie oben gesagt, einfach die alternative rausschmeissen könnte, sozusagen..
    • Madzger
      Madzger
      Bronze
      Dabei seit: 16.09.2005 Beiträge: 915
      jo, verstehe auch nicht, was daran verwirrend ist

      der erste satz sollte vielleicht genauer lauten
      [...] then the expectation of each pure strategie, which is in the support of the optimal strategy, must be equal against the opponent's optimal strategy.

      (support = menge der reinen strategie mit echt positiver wahrscheinlichkeit in der gemischten strategie)

      oder auch of each combination of pure strategies from the support ...

      aber für strategien ausserhalb des supports gilt der satz natürlich nicht
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      was genau ist denn deine frage? :) die erklaerung ist ein bisschen verwirred, weil es was von nem ringschluss hat. vielleicht helfen andere worte?


      "A strategy pair is optimal if neither player can improve his expectation by unilaterally changing his strategy."

      spieler1 spielt optimal, spieler2 spielt optimal.
      -> spieler2 braucht seine strategy also nicht veraendern um seinen EV zu sichern.

      spieler1 strategy beinhaltet einen mix aus variante a und b.

      verschiebt er anteile von a nach b und sein ev steigt (was er wuerde, wenn evA < evB), kommt es zum widerspruch mit der definition, weil spieler1 ev nie steigen darf, wenn er seine strategy veraendert.

      zu diesem widerspruch kommt es immer wenn evA != evB, daher muss evA=evB sein.
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      was vielleicht ein wenig gegend die intuition ist:

      bei schere-stein-papier wird man trotz evA=evB=evC zu einem mix "gezwungen", was man einfach so akzeptiert. warum sollte man dann nicht auch aus irgendwelchen gruenden zu einem mix bei unterschiedlichen EVs gezwungen werden?
    • Madzger
      Madzger
      Bronze
      Dabei seit: 16.09.2005 Beiträge: 915
      Original von hazz
      bei schere-stein-papier wird man trotz evA=evB=evC zu einem mix "gezwungen"
      ergibt keinen sinn imo
      meinst du mit zu einem mix "gezwungen", dass die optimale strategie eine gemischte strategie ist?
      das steht doch nicht im widerspruch dazu, dass verschiedene reine strategien denselben EV haben, wenn der gegner eine optimale strategie spielt

      bei schere-stein-papier haben halt alle drei strategien denselben EV, solange der gegner eine optimale strategie spielt .. dass man 1/3,1/3,1/3 spielen sollte, liegt halt daran, dass der gegner nicht unbedingt die optimale strategie spielt

      was das zitat aus dem buch lediglich sagt, ist dass man wenn man stein, schere, papier um eine zusätzliche strategie erweitern würde ( http://de.youtube.com/watch?v=_mKbnVKdix8 ), die gegen alles andere verliert, dann wäre der EV dieser strategie gegen eine optimale strategie des gegners (die natürlich 1/3,1/3,1/3,0 ist) kleiner als die anderer strategien und daher kann diese strategie nicht im support einer optimalen strategie liegen
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      über eine 4te strategie sagt die passage da doch eigentlich garnix.

      und ja zu "meinst du mit zu einem mix "gezwungen", dass die optimale strategie eine gemischte strategie ist?".
      ich versuchte hier nur irgendwo humpf einzusammeln und den grund fuers nicht verstehen des an sich selbsterklaerenden abschnitts 2 zu finden. wenn ich dann beschreibe wie man falsch denken koennte musst du das nicht korrigieren ;)
    • Madzger
      Madzger
      Bronze
      Dabei seit: 16.09.2005 Beiträge: 915
      ahso .. hatte deinen post falsch verstanden .. dachte, du meinst es wäre richtig was du geschrieben hast :)

      aber die passage sagt doch was über die 4. strategie in meinem beispiel
      "optimal strategies in poker do not contain "loss leaders" "
      = die 4. strategie hat w'keit 0 in der optimalen strategie in meinem beispiel

      ist doch 1:1 dasselbe
    • humpf
      humpf
      Bronze
      Dabei seit: 29.07.2006 Beiträge: 1.331
      Ok, versuche ich mich mal dran.

      Wir spielen Heads-Up NL. Unser Gegner spielt eine optimale Strategie und hat diese in mehrere tausend Bücher geschrieben. Bei einfachen Entscheidungen die keine weiteren Entscheidungen an späteren Strassen erforderlich machen macht der obige Satz durchaus Sinn.

      1) Wir kommen mit unserer Range gegen seine genau bekannte Range an den Turn. Er bettet AI. Wir wissen nun wieder genau welche Range er hat. Wir callen offensichtlich mit den Nuts oder sehr starken Händen. Mit der einen Hand die genau an der Schwelle call oder fold steht ist es egal was wir machen. Diese Hand dient als Bluffcatcher und unserer Gegner hat (da er mixed Strategies spielt und damit seine Bluffs sehr genau timen und adjustieren kann, d.h. er bettet alle starken Hände und genau 34% von 34o als Bluff) uns gleichgültig gegenüber Bluffcatch Calls gemacht.

      Das Problem sind Entscheidungen die auf späteren Strassen weitergeführt werden.

      2) Wir haben AA IP und sind gerade 3bettet worden. Die Alternativen sind nun entweder eine 4bet oder ein Call. Die Aces kann man aber nicht im luftleeren Raum betrachten. Eine blufflastige 4bet Range profitiert von den Aces als Valuehand, d.h. die Aces steigern den Wert der Bluffs (da der Gegner schlechter 5bet shoven kann) und die Bluffs steigern den Wert der Aces (da der Gegner nicht so einfach aufgeben kann mit einer schwachen HAnd). Ähnliche Argumente können für die 3bet Range gemacht werden. Hat man mehrere Aces sind seiner Range kann man am Flop profitabel semibluffshoven. Die Aces haben also einen EV alleine (den man einfach ausrechnen kann indem man einen postflop Plan für seine Aces fasst und den PLan aus den Büchern seines Gegners nimmt und damit einen Gesamt EV berechnet). Andererseits hat die gesamte Distribution die man nach einer 4bet bzw. 3bet call hat ebenfalls einen (globalen) EV.
      Die Frage ist nun: Berechnet man den Gesamt EV aller Hände in der Range nach einer bestimmten Aktion? Berechnet man nur den einzelnen EV?

      Theoretisch müsste der optimalen Strategie ja egal sein was der Gegner hat. Sie kümmert sich nicht um unsere Ranges sondern spielt stur ihre perfekt gebalancte Lines. Wäre es in diesem Fall wirlich egal was man mit den Assen macht? Wenn man berechnen könnte, dass ein 4bet/shove am besten ist (da die optimale Strategie mit 99+, AJ+ shovt), würde dies heißen der Call einer 3bet mit AA ist falsch?
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      Original von humpf
      Wenn man berechnen könnte, dass ein 4bet/shove am besten ist (da die optimale Strategie mit 99+, AJ+ shovt), würde dies heißen der Call einer 3bet mit AA ist falsch?
      ja.


      und globaler EV interessiert so nicht. immer nur der EV jeder einzelnen aktion. die alternative ist ja immer eine strategie fuer dich, die in dieser einzelnen aktion anders entscheidet. und wenn die mehr EV hat ist sie auch besser gesamt (weil villain nicht adapted/adapten muss weil du vorher suboptimal warst).

      der globale EV wird durch herausnehmen der aces auch niemals negativ, denn das wuerde bedeuten, dass du loss-leader drin hast - und die darf es ja nicht geben bzw kannst du einfach rausschmeisen.
    • Nichtschwimmer
      Nichtschwimmer
      Black
      Dabei seit: 19.02.2007 Beiträge: 6.974
      Ich sehe das anderes - es muss bei einer optimalen Strategie doch darum gehen, den EV für die globale Range zu maximieren. Außerdem ist es doch möglich, dass das Optimum z.B. darin besteht, Aces zu 82% zu 4-betten und sonst zu callen, damit wir die Hand in beiden Ranges drin haben. Das würde auch den EV der Calling-Range erhöhen, obwohl der EV der 4-Betting-Range natürlich sinkt, trotzdem kann es insgesamt besser sein, als AA immer zu 4-betten.
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      wir widersprechen uns da glaube ich nicht (kommt drauf an was du anders siehst).

      wenn du jeden einzelnen EV maximierst landest du automatisch beim globalen optimum. du musst bloss kein shania oder sonstwas bedenken.
      edit: humpf benutzte imo global im sinne von "ev der range in einem spot/einer line", ab deinem post dann global=total.
    • Nichtschwimmer
      Nichtschwimmer
      Black
      Dabei seit: 19.02.2007 Beiträge: 6.974
      Original von hazz
      wenn du jeden einzelnen EV maximierst landest du automatisch beim globalen optimum.
      Sicher? Es kann doch sein, dass ich, wenn ich QT auf nem 27Q-Flop checkraise, für QT isoliert nen höheren EV habe als wenn ich nur flatte. Trotzdem kann der Flat besser für meine Range sein, weil Villain weniger Hands von uns am Turn rausbluffen kann und der EV mit den schwachen Händen, mit denen ich den Flop nur peele, steigt, weil ich seltener 2-3 Barrels bekomme, somit häufiger zum Showdown kann und nicht so oft die beste Hand folde.
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      nein genau darum geht es ja in dem 2. teil ausm ersten post.

      (villain spielt schon optimal, er adapted nicht - dh ob du nun AA zu deinen bluffs packst oder nicht ist total egal, weil es den ev der bluffs nicht veraendert, weil sich villains range nicht aendert - du fährst also am besten wenn du dir die line mit dem hoehsten EV fuer AA aussuchst.)

      PS: ja, es kann sein dass du AA auf call und raise splitten musst, dann ist aber der ev fuer beide lines fuer AA gleich und das "muessen" ist dasselbe muessen wie bei schere-stein-papier (villain koennte exploitive gegen dich spielen).
    • humpf
      humpf
      Bronze
      Dabei seit: 29.07.2006 Beiträge: 1.331
      Original von Nichtschwimmer
      Original von hazz
      wenn du jeden einzelnen EV maximierst landest du automatisch beim globalen optimum.
      Sicher? Es kann doch sein, dass ich, wenn ich QT auf nem 27Q-Flop checkraise, für QT isoliert nen höheren EV habe als wenn ich nur flatte. Trotzdem kann der Flat besser für meine Range sein, weil Villain weniger Hands von uns am Turn rausbluffen kann und der EV mit den schwachen Händen, mit denen ich den Flop nur peele, steigt, weil ich seltener 2-3 Barrels bekomme, somit häufiger zum Showdown kann und nicht so oft die beste Hand folde.
      So denke ich eben auch, aber ich bin mir nicht sicher ob diese intuitive Herangehensweise stimmt.

      Und ja: global EV= EV der gesamten Range in einem Spot
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      ich kanns nur nochmal wiederholen:


      "villain spielt schon optimal, er adapted nicht - dh ob du nun AA zu deinen bluffs packst oder nicht ist total egal, weil es den ev der bluffs nicht veraendert, weil sich villains range nicht aendert - du fährst also am besten wenn du dir die line mit dem hoehsten EV fuer AA aussuchst."


      EV(gesamt) = EV(bluff) + EV(AA)

      EV(bluff) wird durch dein play mit AA nicht beeinflusst, da villains range fix ist.
      Willst du jetzt EV(gesamt) maximieren kannst du beide EVs einzeln betrachten, weil sie unabhaengig sind (immer unter der vorraussetzung, dass villain schon optimal spielt).
    • Nichtschwimmer
      Nichtschwimmer
      Black
      Dabei seit: 19.02.2007 Beiträge: 6.974
      Seit wann reden wir davon, das Villain auch optimal spielt/statische Ranges hat? Ich denke, es geht hier darum, dass wir eine optimale Strategie entwickeln wollen, diese ist von Villains Spielweise völlig unabhängig.

      E: Auf Hazz bezogen
    • Nichtschwimmer
      Nichtschwimmer
      Black
      Dabei seit: 19.02.2007 Beiträge: 6.974
      Und das AA-Beispiel check ich grade nicht so ganz, da es durchaus Situationen gibt, in denen wir mit AA Bluffen würden und wir Preflop mit AA nicht dazu in der Lage sind, zu bluffen.
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      "2) As a corollary to this, if an optimal strategy contains a mixed strategy, then the expectation of each strategic alternative must be equal against the opponent's optimal strategy."


      und davon abgesehen kannst du natuerlich testen ob deine strategie optimal ist, indem du schaust ob es eine andere gibt, die gegen einen optimal spielenden gegner einen hoeheren EV hat. eine optimale strategie zeichnet sich ja dadurch aus, dass sie den maximalen EV gegen den optimalen gegner hat.

      (AA) stand exemplarisch fuer valuehand bzw QT aus humpf beispiel.
    • Madzger
      Madzger
      Bronze
      Dabei seit: 16.09.2005 Beiträge: 915
      pfft .. hazz ist schneller
      ich hätte alles genauso geschrieben :D