Spieltheorie und Poker

    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Mit spieltheoretischen Methoden kann man ganz gut sehen, daß es oftmals nicht die eine perfekte Line gibt, die man immer spielt, sondern schon in ganz einfachen Fällen eine gemischte Strategie gefahren werden sollte.

      Es wurde schon in der Bronzesektion angeraten. die selbe Standardline mit verschiedenen Händen spielen z.B. im HU Call Flop Raise Turn mit gescheiten Made Hands, aber auch mit Draws oder ab und zu Pure Bluffs.
      Aber genauso sollte man auch überlegen, verschiedene Lines mit den selben Händen spielen (war glaube ich auch Thema in einem Video von Benido).

      Auf die Frequenz kommt es an. Sobald Villain merkt, daß du mit starken Händen immer call Flop raise Turn oder bet/3-Bet Flop bet Turn spielst, dann werden andere Lines automatisch anderen Händen zugeordnet. Villain denkt z.B. bei Call Flop call Turn oder bei Bet Flop check Turn, daß du eine schwache Hand hältst.

      Wenn du aber nicht weißt, wie gut Villain adaptet oder wenn du davon ausgehen mußt, daß er allgemein so ziemlich optimal spielt dann solltest du auch optimal spielen d.h. in geeigneten Situationen (wenn es dem Value nicht schadet) die selbe Hand mit einer anderen Line spielen.

      Es gibt da auch ein nettes und einfaches Einführungsbeispiel, vielleicht kennt ihr das schon aus der Literatur, aber ich stelle es mal vor:

      Wir spielen Fixed Limit HU, aber nicht Texas Hold'Em sondern ein viel einfacheres Spiel. Es gibt nur eine Bietrunde und nur 3 Karten A,K,Q im Deck. Jeder bekommt eine Karte. Wenn es einen Showdown gibt, dann gewinnt die höchste Karte. Es darf nicht ge-3-bettet werden.

      Das ist gar nicht mal so extrem von Hold'Em entfernt, denn so eine Situation kann man z.B. haben, wenn beim Hold'Em wo in einem capped Pot Quads mit einem low Kicker auf dem Board liegen, und beide Spieler nur noch QQ+ in ihrer Range haben. Was bedeutet, daß der höchste Kicker gewinnt und auf dem Board liegen 33332. In so einer Situation reduziert sich Poker letztlich auf so ein einfaches Spiel.

      Ok. SB bezahlt $1 und BB bezahlt $2 als Blinds. Es gibt folgende Lines:

      f) SB foldet --> BB bekommt die Blinds, d.h. EV=(0,3)
      B1a) SB openlimpt --> BB checkt ---> Showdown --> SB gewinnt EV=(3,0)
      B1b) SB openlimpt --> BB checkt ---> Showdown --> BB gewinnt EV=(-1,4)
      B2) SB openlimpt --> BB raises --> SB folds --> EV=(-1,4)
      B3a) SB openlimpt --> BB raises ---> SB calls ---> SB gewinnt --> EV=(5,-2)
      B3b) SB openlimpt --> BB raises ---> SB calls ---> BB gewinnt --> EV=(-3,6)
      B4) SB raist --> BB folds ---> EV=(3,0)
      B5a) SB raist --> BB calls ---> SB gewinnt --> EV=(5,-2)
      B5b) SB raist --> BB calls ---> BB gewinnt --> EV=(-3,6)


      SB kann also folgende Strategien verfolgen:
      L-Limp
      f-fold
      c-check oder call
      r- raise

      f,Lf,Lc,r

      BB hat wiederum die Strategien:

      c wenn SB l und f wenn SB r, was wir als (c,f) bezeichnen wollen
      (c,c)
      (r,f)
      (r,c)

      Das Spiel hat also folgende Auszahlungsmatrix, wenn BB die bessere Hand hat:
      ---|(c,f) |(c,c) |(r,f) |(r,c) |
      --------------------------------------
      f |(0,3) |(0,3) |(0,3) |(0,3) |
      Lf |(-1,4)|(-1,4)|(-1,4)|(-1,4)|
      Lc |(-1,4)|(-1,4)|(-3,6)|(-3,6)|
      r |(3,0) |(-3,6)|(3,0) |(-3,6)|
      -----------------------------------------


      und folgende, wenn SB die bessere Hand hat:

      ---|(c,f) |(c,c) |(r,f) |(r,c) |
      --------------------------------------
      f |(0,3)|(0,3)|(0,3) |(0,3) |
      Lf |(3,0)|(3,0)|(-1,4)|(-1,4)|
      Lc |(3,0)|(3,0)|(5,-2)|(5,-2)|
      r |(3,0)|(5,-2)|(3,0)|(5,-2)|
      -----------------------------------------

      Equities und Ranges:

      Q<K<A, also

      Eq(Q vs. {A,K})=0
      Eq(K vs. {A,Q})=0.5
      Eq(A vs. {K,Q})=1

      Seien p1,p2,p3,p4 die Wahrscheinlichkeiten für f,Lf,Lc,r bei SB und
      q1,1-q1 die Wahrscheinlichkeiten für c,r vs. Limp
      q3,1-q3 die Wahrscheinlichkeiten für f,c vs. Raise

      Nun ergeben sich trivialerweise folgende Dinge:

      1.) Ein Ass wird nie gefoldet
      2.) Eine Queen wird nie gecallt oder gelimpt

      Daraus folgt auch

      3.) Ein König wird nie geraist.


      Kartenverteilungen an SB, BB

      1.) SB bekommt A, BB bekommt Q , kurz (A,Q)

      -> SB limp/callt oder raist
      -> BB callt nie, d.h. raise, fold oder check behind

      EV=p3*(q1*(3,0)+(1-q1)*(5,-2))+p4*(3,0)

      Wenn SB wüßte, das BB eine Q hat, würde er also das A limpen.
      Wenn BB wüßte, das SB ein A hat, würde er seine Q nie raisen.

      2.) (A,K)

      -> SB limp/callt oder raist
      -> BB callt, checkt behind oder foldet

      EV=p3*(3,0)+p4*(q3*(3,0)+(1-q3)*(5,-2))

      Hier ist es genau umgekehrt. Wenn SB wüßte, daß Villain einen K hat, dann würde er das A raisen. Wenn BB wüßte, daß BB ein A hat, würde er den K nie callen.

      Der EV für die Situation: SB hat A ergibt sich also wie folgt:


      EV=1/2*[p3*((q1+1)*(3,0)+(1-q1)*(5,-2))+p4*((1+q3)*(3,0)+(1-q3)*(5,-2)))]

      Wenn wir jetzt den EV nur aus Sicht von SB sehen, dann heißt das

      EV("SB hat A")=1/2*[p3*((q1+1)*3+(1-q1)*5)+p4*((1+q3)*3+(1-q3)*5)]
      =p3*(4-q1)+(1-p3)*(4-q3)
      =p3*(q3-q1)-q3+4

      Der minimale EV ist 3 und der maximal mögliche EV ist 4.
      Wenn BB genau so oft Q behind checkt wie K auf einen raise foldet, dann haben wir einen EV von -q3+4, der unabhängig davon ist, ob wir das A limpen oder raisen.
      Wenn BB jedoch öfter Q behind checkt als K foldet, dann ist q3-q1<0 und wir sollten bevorzugt raisen.
      Wenn BB öfter K foldet als Q behind checkt, dann ist q3-q1>0 und wir sollten bevorzugt limpen.


      Aufgabe an den geneigten Leser:
      Wie mußt du als SB mit K spielen, wie mit Q?
  • 31 Antworten
    • xlabix
      xlabix
      Black
      Dabei seit: 10.07.2006 Beiträge: 1.905
      Kurze Verständnisfrage. Stand gerade auf dem Schlauch. Denk aber, dass ichs mittlerweile richtig verstanden habe.

      SB bezahlt $1 und BB bezahlt $2 als Blinds.
      Es gibt folgende Lines:
      f) SB foldet --> BB bekommt die Blinds, d.h. EV=(0,3)
      B1a) SB openlimpt --> BB checkt ---> Showdown --> SB gewinnt EV=(3,0)
      B1b) SB openlimpt --> BB checkt ---> Showdown --> BB gewinnt EV=(-1,4)

      B2) SB openlimpt --> BB raises --> SB folds --> EV=(-1,4)
      B3a) SB openlimpt --> BB raises ---> SB calls ---> SB gewinnt --> EV=(5,-2)
      B3b) SB openlimpt --> BB raises ---> SB calls ---> BB gewinnt --> EV=(-3,6)
      B4) SB raist --> BB folds ---> EV=(3,0)
      B5a) SB raist --> BB calls ---> SB gewinnt --> EV=(5,-2)
      B5b) SB raist --> BB calls ---> BB gewinnt --> EV=(-3,6)


      Zuerst f): Das zusätzliche Investment von SB ist 0 - sprich fold. BB gewinnt den kompletten Pot mit 3 SB. Nun zu B1a) SB openlimpt und gewinnt. Das macht summa summarum eigtl einen Pot von 4 SB, aber es wird nun die 1 SB Investment widerum abgezogen und somit gewinnt er netto 3 SB. BB hat nicht zusätzlich investiert und verliert somit 0. Bei B1b) ist es so, dass SB 1 SB Investment hat daher -1 und BB nun die kompletten 4 BB gewinnt.

      Das ist doch seltsam. Sprich bei SB wird der Blind als gesetzt rausgerechnet; ergo mit dem Nettogewinn gerechnet bei - beim BB wird der Gesamtgewinn genommen. Richtig?

      Etwas verwirrend das Ganze, oder nicht?! Zumin. hat es mich das gerade :)
    • xlabix
      xlabix
      Black
      Dabei seit: 10.07.2006 Beiträge: 1.905
      .
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Du hast das richtig verstanden. SB muß noch 1 SB investieren, um zum Showdown zu kommen, während BB nichts mehr investieren muß, also ohne Abzüge gewinnt.
      Werde demnächst dann auch mal die Komplettlösung posten, zumindest die Ergebnisse.
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Ok, ich löse das Ganze mal auf. Es ist ganz einfach:

      1. Da man Q nicht limpen sollte, bleibt nur raise oder fold. Aber da Villain zu 50% das Ass hat, das er sowieso nicht foldet, lohnt sich der Raise nicht. Wird man gecallt, verliert man 2, foldet Villain den K, gewinnt man 4. Selbst wenn Villain jeden K folden würde, wären wir nur BE. Also wird SB Q stets folden.

      2. Da Q stets gefoldet wird und man K nicht raist, weiß BB bei einem Raise, daß man das Ass hat. Also wird er nichts callen. Daraus folgt, daß man A immer limp/call spielen muß.

      3. Limpt SB, dann kann BB mit einer Q theoretisch behind checken oder raisen. Da mindestens die Hälfte der Limps aber das Ass sind, lohnt sich der Raise nicht, denn wir gewinnen bei einem Fold $4, investieren aber stets $2. Deshalb wird Q behind checken und nur A wird raisen.

      4. Weil aber nur A raist, kann SB K stets limp/fold spielen.

      Ergo:

      SB:

      A- limp/call
      K- limp/fold
      Q- fold

      BB:
      A- raise
      K- check behind
      Q- check behind

      Dieses Spiel ist also deterministisch lösbar, sofern beide Spieler thinking player sind. Würden beide Spieler statt der Blinds gleichgroße Antes zahlen, wäre dem im Übrigen nicht so. Und genau darauf möchte ich nun hinaus mit der nächsten Schwierigkeitsstufe.

      Was nun aber wenn wir in einer HU-Situation im realen Pokerleben sind und folgendes Board haben:

      2 :diamond: 5:diamond: 7 :diamond: T :diamond: J :diamond:

      und auf Grund der Action beide Gegner davon ausgehen müssen, daß ihr Gegner den Nutflush, 2nd Nutflush oder 3rd Nutflush hat, d.h. beide Spieler haben eine der Karten A :diamond: , K :diamond: oder Q :diamond: auf der Hand.

      Welche Lines würdet ihr am River mit A,K,Q in :diamond: spielen und warum?
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      Original von SanWogi
      3. Limpt SB, dann kann BB mit einer Q theoretisch behind checken oder raisen. Da mindestens die Hälfte der Limps aber das Ass sind, lohnt sich der Raise nicht, denn wir gewinnen bei einem Fold $4, investieren aber stets $2. Deshalb wird Q behind checken und nur A wird raisen.
      leider sind 50% fe aber schon profitabel...
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Ok, betrachten wir das ganze nun einmal für den Fall, daß wir oop die
      Q :diamond: auf dem besagten Board halten und keine 3-Bets erlaubt sind.

      Wir wissen, daß Villain den K:diamond: oder A:diamond: hält. Wir haben eine Equity von 0% und Villain wird zumindest A:diamond: niemals folden, weil es die Nutz sind. In der Hälfte der Fälle hat er aber K :diamond: . Er wird K :diamond: nicht raisen, weil wir dann Q :diamond: folden und mit A :diamond: callen.
      Günstig für uns wären folgende Szenarien:

      1.) Wir check/folden (kostet uns nichts)
      2.) Wir bet/folden und er foldet K:diamond: oft genug.

      Aber was ist "oft genug"? Sei P die Potgröße und a die Frequenz, mit der Villain den K foldet.

      EV(bet/fold Q oop)=0.5*(-1)+0.5*(-(1-a)+P*a)
      =0.5*((P+1)*a-2) >0

      falls

      Wkt(K callt)=1-a<(P-1)/(P+1) bzw.
      Wkt(K foldet)=a>2/(P+1)

      Ist der Pot vor unserer Bet also 9 BB groß, so muß er also den König in mindestens 2 von 10 Fällen folden, damit wir profitabel Q betten können.
      Je nachdem, ob wir das als gegeben ansehen bluffbetten wir mit einer Frequenz b. D.h.

      EV(Q)=b/2*[(P+1)*a-2]

      Würde Villain stets mit einer Frequenz von >2/(P+1) folden, könnten wir b=1 wählen, also stets bluffen. Aber wie wir sehen werden, hängt die Frequenz, mit der er foldet von der History ab.

      Versetzen wir uns nun in die Lage von Villain. Wenn er K hält und wir checken, dann checkt er behind. Aber was macht er wenn wir betten?
      Er kann sinnvollerweise callen oder folden.

      Sei b die Wahrscheinlichkeit, daß Q bettet und c die Wahrscheinlichkeit, daß Ass bettet, dann

      EV(K foldet)=0;
      EV(K callt)=1/(b+c)*(b*(P+1)-c)>0
      falls b>c/(P+1) bzw. b*(P+1)>c

      Villain callt die Bet, wenn er der Ansicht ist, daß wir das Ass weniger als (P+1)- mal so oft betten wie die Q. Denn dann nimmt er oft genug den Pot mit um BE zu sein.

      insgesamt(wenn er eine Frequenz a foldet):

      EV(K)=(1-a)/(b+c)*(b*(P+1)-c)

      Zurück zu Hero. Mit dem Wissen, daß Villain nur dann überhaupt den König weglegt, wenn er nicht allzu oft die Q zu Gesicht bekommt, empfiehlt es sich, zunächst in eben dieser Frequenz zu bluffen, d.h. zufällig mit der Wahrscheinlichkeit c/(P+1).

      Doch wie groß ist c? Wie häufig sollten wir das Ass betten?
      Das hängt wiederum davon ab, wie oft Villain K callt und Q raist. Angenommen er raist Q mit Wahrscheinlichkeit d und bettet auf einen check mit der Wahrscheinlichkeit e.

      EV( bet/call A ) =0.5*(a*P+(1-a)*(P+1)+d*(P+2)+(1-d)*P)
      =0.5*(2*P+2*d-a+1)
      EV(check/raise A)=0.5*(P+e*(P+1)+(1-e)*P)
      =0.5*(2*P+e)

      d.h. EV(bet/call A)>EV(check/raise A), falls 2*d-a+1>e.

      Es lohnt sich aber nicht, K zu bet/folden, da wir nie gecallt werden und sowieso nur die schlechtere Hand foldet.

      Und wie sieht das Villain? Villain callt wie gesagt den K, wenn er denkt, daß wir oft genug bluffen. Da wir K nicht bet/folden, macht es für ihn keinen Sinn Q zu raisen. Das bedeutet, daß d=0. Damit gilt für Hero:

      EV(bet/call A)>EV(check/raise A), falls 1-a=Wkt(K calls)>e=Wkt(Q bets to check).

      --> Wir betten das A, wenn Villain öfter K callt, als Q zu bluffbetten.

      Frage: Wie oft sollten wir als Default A gegen einen thinking player betten?
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Original von hazz
      Original von SanWogi
      3. Limpt SB, dann kann BB mit einer Q theoretisch behind checken oder raisen. Da mindestens die Hälfte der Limps aber das Ass sind, lohnt sich der Raise nicht, denn wir gewinnen bei einem Fold $4, investieren aber stets $2. Deshalb wird Q behind checken und nur A wird raisen.
      leider sind 50% fe aber schon profitabel...
      Wenn A wirklich nie raist und K in einem von drölfmillionen Fällen auch mal einen Raise callt, dann haben wir <50% fe und der Raise ist nicht profitabel.
      Aber ich muß eingestehen, daß meine Lösung am Rand unscharf ist.
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Ich glaube, die Aufgabe war als Einführungsbeispiel zu komplex.
      Da ich ein möglichst triviales Einführungsbeispiel geben wollte vereinfache ich es noch mal auf folgendes Setup:

      Pot hat die Größe P, Hero ist oop und Villain ip. Das Board ist
      2:diamond: 5:diamond: 7:diamond: T:diamond: J:diamond: .

      Hero hat am River gecheckraist und wurde ge-3-bettet. Nun kann er folden, callen oder cappen. Villain kann nur noch callen oder auf den Cap folden.
      Beide halten sich gegenseitig für thinking player und beide wissen von dem anderen, daß er A,K oder Q in :diamond: hat.

      Poker ist ein sequentielles Spiel mit imperfekter Information (ein Bayesssches Spiel). Wir können also auch unser Beispiel mit der Sprache der Spieltheorie beschreiben. In unserer Situation folgende Informationen relevant:

      I)Wer spielt?

      Zwei Spieler Hero und Villain, wobei Hero oop sitzt, also den ersten Zug hat.

      II) Welche Kartenverteilungen kann es geben?

      Wenn Hero die Karte A hat und Villain die Karte K, dann sei dies das Paar (A,K). Es gibt also die folgende Menge von Kartenverteilungen:

      {(A,K),(A,Q),(K,A),(K,Q),(Q,A),(A,Q)}

      Jede dieser Kartenverteilungen ergibt ein für sich genommen einzigartiges Spiel.

      III) Welche Aktionen sind möglich:

      Hero kann folgende Lines spielen: f,c,cap

      Villain kommt nur noch zum Einsatz, wenn Hero cappt. Dann kann er callen oder folden.

      IV) Die Auszahlungsfunktion u ist eine Abbildung, die jeder Kartenverteilung und jeder Aktion einen reellen Wert zuordnet.

      z.B. Wenn Hero A hat und cappt und Villain K hat und callt, dann haben wir

      uH(b,c)=P+3-2=P+1 (er gewinnt den capped Pot, investiert dafür aber zwei weitere Bets)

      Villains Auszahlungsfunktion ist in diesem Fall:

      uV(b,c)=-1 (er verliert eine Bet)

      V) Reine Strategien

      Reine Strategien sind schlicht die Lines, die möglich sind.

      Wenn Hero A hat gibt es nur eine sinnvolle Strategie:

      cap

      Der Call macht keinen Sinn, da Hero Villain ermöglichen will, das Maximum zu bezahlen.

      Villain hat mit K folgende reine Strategien gegen den Cap zur Auswahl:

      call, fold

      Nun kann er eine gemischte Strategie fahren, d.h. er kann mit Wahrscheinlichkeit p1 callen und mit Wahrscheinlichkeit 1-p1 folden.

      Es gibt auf Grund der Kartenverteilung nun 6 gleichwahrscheinlicheFälle für die wir den Payoff ausrechnen wollen:

      1. (A,K)

      Hero gewinnt P+1, wenn Villain callt. Das passiert mit der Wahrscheinlichkeit p1.

      Hero gewinnt nur P, wenn Villain foldet. Das passiert mit der Wahrscheinlichkeit 1-p1.

      2. (A,Q)

      Mit Q wird Villain niemals callen. D.h. Hero gewinnt immer P.

      3. (K,A)

      Hero kann folden oder callen. Cappen macht keinen Sinn, da Villain Q eh' nicht callt, sondern nur A.

      Wenn Hero mit der Wahrscheinlichkeit q1 den König foldet, dann gewinnt er 0 mit Wahrscheinlichkeit q1 und verliert 1 mit Wahrscheinlichkeit 1-q1.

      4. (K,Q)

      Hero gewinnt 0 mit Wahrscheinlichkeit q1 und gewinnt P mit Wahrscheinlichkeit 1-q1.

      5. (Q,A)

      Hero kann folden oder cappen. Callen macht keinen Sinn mit Q.
      Hero folde Q mit der Wahrscheinlichkeit q2. Dann verliert er 0 mit Wahrscheinlichkeit q2 und verliert 2 mit Wahrscheinlichkeit 1-q2.

      6. (Q,K)

      Hero verliert 0 mit Wahrscheinlichkeit q2.
      Hero verliert 2 mit Wahrscheinlichkeit (1-q2)*p1 (Villain callt K)
      Hero gewinnt P mit Wahrscheinlichkeit (1-q2)*(1-p1) (Villain foldet K)

      Wie groß ist nun der EV?

      EV=1/6*[(P+1)*p1+P*(1-p1+1+1-q1+(1-q2)*(1-p1))-1*(1-q1)-2*(1-q2)*(1+p1)]

      Uns interessiert, inwieweit der EV davon abhängt, was Villain mit K macht,d.h. wir suchen uns den Teil raus, der mit p1 zusammenhängt:

      6*EV=p1*(P+1+P*(-1-1+q2)-2+2*q2)+...
      =p1*((P+2)*q2-(P+1))+...

      Unser EV ist unabhängig von Villains Strategie, wenn
      (P+2)*q2-(P+1)=0 d.h. q2=(P+1)/(P+2) bzw. 1-q2=1/(P+2).

      GTO wäre also, Q in einem von P+2 Fällen zu bluffen.

      Wenn wir Q GTO spielen, dann bleibt immer noch die Frage, wie wir K spielen sollen. Die ist aber auf Grund der Pot Odds leicht zu beantworten. Wir liegen in der Hälfte der Fälle vorne und der Pot braucht also nur 1 BB groß zu sein, damit sich der Call lohnt. Betrachte dazu

      6*EV=P*(1-q1+4-q2)-(1-q1)-2-2*q2
      =(1-q1)*(P-1)+4*P-q2*(P-2)-2

      Den hinteren Teil können wir nicht ändern. Aber wir callen K mit Wahrscheinlichkeit 1-q1. Ist P>1, so haben wir als immer einen profitablen Call und brauchen K nie zu folden.


      Ich denke, das Beispiel hat jeder verstanden. Auf Englisch kann man eine ähnliche Rechnung auch bei Swanson nachlesen. Es ist kein großes mathematisches Vorwissen erforderlich.

      Aufgabe: Was ändert sich, wenn wir davon ausgehen müssen, daß Villain, der ja immerhin den River 3-bettet, dies nicht zu gleichen Teilen mit allen hohen Flushs macht, sondern wenn er A hat, 3-bettet er immer. Wenn er K hat zu 50% und wenn er Q hat, nur zu 20%.

      D.h. zum Beispiel wenn wir K haben, dann hat er A 5 mal öfter in seiner Range als Q, was bedeutet, daß 5/6 seiner Range A sind.
    • D0nkey
      D0nkey
      Bronze
      Dabei seit: 12.08.2009 Beiträge: 1.247
      interessant, thx für die ausführungen :)
      ich schreib grad meine Facharbeit über Poker und will uach noch was in der Richtung mitreinbringen, von welchem Buch hast du das erste beispiel?


      btw noch ne kleinigkeit, ich schätz du wolltest das letzte board so wählen, dass Ad die Nuts bildet, geht aber auch noch 8d9d drum hät ich die 7 in heart oder so genommen, aber naja letzlich egal :D
    • geldsegen
      geldsegen
      Global
      Dabei seit: 07.05.2008 Beiträge: 3.151
      wenn villain 1:2 bekommt sollte villain seinen K in 1:2 fällen folden, genauso wie hero seine Q in 1:2 fällen bluffen sollte (odds 1:2 vorrausgesetzt)
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      @Donkey: Die relativen Nutz reichen mir hier, weil ich in der Aufgabe ja schon angebe, daß beide die Range vom Gegner kennen.
      Das erste Beispiel ist nur eine abgewandelte Form von dem Beispiel bei Swanson. Irgendwie frage ich mich auch, ob meine Lösung davon wirklich stimmt. Keine Garantie!
      Swanson hatte das Spiel übrigens mit Antes statt Blinds gemacht und ohne die Möglichkeit zu raisen.
      Ein sehr lesenswertes Paper für dein Facharbeit wäre z.B. [URL=http://www.math.ucla.edu/~tom/papers/poker1.pdf]Ferguson.[/URL]
      (Ja genau, das ist von "Jesus" :D )

      @Geldsegen: Sicherlich korrekt, ich weiß nur gerade nicht auf welchen meiner Beiträge du dich bezogen hast.
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Lösung zu der Aufgabe:

      Bei gewichteten Ranges haben die Kartenverteilungen keine gleichen Wahrscheinlichkeiten mehr. 3-bettet Villain am River K nur zu 50% und Q nur zu 20%, so haben wir für die Kombination (A,Q) lediglich die Wahrscheinlichkeit 1/3*0.2/(0.5+0.2)=2/21 <1/6. Dafür kommt (A,K) häufiger vor, nämlich in 1/3*0.5/(0.2+0.5)=5/21>1/6 der Fälle.
      Die Neugewichtung ändert natürlich nichts Wesentliches in der EV-Formel, lediglich Vorfaktoren. Wir interessieren uns zunächst nur für die Fälle, wo Villain K hat, weil wir unsere Q nach GTO spielen wollen, also eine nicht exploitbare Blufffrequenz nutzen wollen. Wie wir oben schon gesehen haben, müssen wir dazu den Faktor hinter p1 Null setzen. Das bedeutet, wir schauen uns vom EV nur den Anteil an, wo Villain K hat.

      Zur Erinnerung: Sind bei Villain die Hände gleich verteilt so:

      6*EV =(P+1)*p1+(1-p1)*P+(1-q2)*(1-p1)*P-2*(1-q2)*p1+...
      =p1*(P+1-P-P+q2*P+2*q2-2)+...
      =p1*(q2*(P+2)-1-P)+...

      so daß wir mit q2=(P+1)/(P+2) GTO spielen.

      Mit den neuen Gewichten ist nun

      3*EV =(P+1)*p1*5/7+(1-p1)*P*5/7+(1-q2)*(1-p1)*P*1/3-2*(1-q2)*p1*1/3+...
      =p1*((P+1-P)*5/7-(P+q2*P+2*q2-2)*1/3)+...
      =p1*(q2*(P+2)*1/3+(5/7-2/3)-P*1/3)+...

      Damit folgt für GTO:

      q2=(P+(2/3-5/7)*3)/(P+2)
      =(P-1/7)/(P+2)

      bzw.
      1-q2= 15/7/(P+2) was etwas mehr als 2/(P+2) ist.

      Wir sollten also die Q öfter bluffcappen, um nicht exploitet zu werden. Was ziemlich kontraintuitiv erscheint angesichts der Tatsache, daß er öfter das Ass hält als im vorigen Fall. Aber wir bluffen die Q hier nicht hauptsächlich, weil er K folden könnte, sondern weil wir wollen, daß wir für unser Ass Payoff bekommen. Denn dadurch, daß er, wenn wir das Ass haben, in 5/7 der Fälle K hat und damit oft genug callt, können wir die 2/3 der Fälle, wo er unseren Q-Bluffraise mit seinem A callt mehr als ausgleichen.

      Wie man sieht hängt die optimale Bluffingfrequenz von drei Faktoren ab:

      1. Potgröße (Ist der Pot groß, kann man im Limit Hold'Em nicht so oft bluffen, weil der Gegner sehr gute Odds bekommt)

      2. Foldequity gegen bessere Hände (hier: K kann folden, wenn wir Q bluffcappen)

      3. Callinduce von schlechteren Händen, wenn wir for Value spielen.
      (hier: K wird oft genug callen, wenn wir A valuecappen)


      Dabei können sich dabei zwei Faktoren auch mal "widersprechen". D.h. der Bluff darf isoliert für die Hand betrachtet durchaus auch -EV sein (weil Villain "zu" oft callt), wenn er dann aber dafür unser Valueplay hinreichend improved,d.h. wir tatsächlich öfter ausbezahlt werden, wenn wir for Value spielen.
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      Original von SanWogi
      Original von hazz
      Original von SanWogi
      3. Limpt SB, dann kann BB mit einer Q theoretisch behind checken oder raisen. Da mindestens die Hälfte der Limps aber das Ass sind, lohnt sich der Raise nicht, denn wir gewinnen bei einem Fold $4, investieren aber stets $2. Deshalb wird Q behind checken und nur A wird raisen.
      leider sind 50% fe aber schon profitabel...
      Wenn A wirklich nie raist und K in einem von drölfmillionen Fällen auch mal einen Raise callt, dann haben wir <50% fe und der Raise ist nicht profitabel.
      Aber ich muß eingestehen, daß meine Lösung am Rand unscharf ist.
      nein, du hast es nicht verstanden: wenn du 2$ riskierst um 4$ im pot zu gewinnen, dann reicht 33% fe. nichts mit am rand unscharf, wenn er mal kings callt..
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Die Argumentation mit der Potsize war in der Tat ein Griff ins Klo, da hast du Recht.
      Ich korrigiere meine Lösung für das erste Beispiel auch. Aber Q wird trotzdem nicht aus dem BB gebluffraist. Es mag zwar isoliert betrachtet in vielen Fällen profitabel sein, Q aus dem BB zu bluffraisen, aber es ist nicht GTO.
      Um dies zu begründen, gebe ich den Rechenweg für die GTO-Lösung von SB und von BB an. Zunächst SB.

      Es gibt 6 gleichwahrscheinliche Fälle:

      1. (A,K)

      Hero limp/callt A mit Wkt. q1. Villain wird K nie raisen, also gewinnt Hero $3.
      Hero raist A mit Wkt. 1-q1. Villain callt K mit Wkt. p1. Dann gewinnt Hero $5.
      Villain foldet mit Wkt. 1-p1. In dem Fall gewinnt Hero nur $3.

      2. (A,Q)

      Hero limp/callt mit Wkt. q1. Villain wird Q mit Wahrscheinlichkeit p2 behind checken. Dann gewinnt Hero $3.
      Villain wird Q mit Wahrscheinlichkeit 1-p2 raisen. Dann gewinnt Hero $5.
      Hero raist A mit Wkt. 1-q1. Villain wird Q nie callen, also gewinnt Hero $3.

      3. (K,A)

      Hero limp/callt K mit Wkt. q2*q3. Er verliert $3
      Hero limp/foldet K mit Wkt q2*(1-q3). Er verliert $1.

      4. (K,Q)

      Hero limp/callt K mit Wkt. q2*q3. Villain raist mit Wkt. 1-p2. In diesem Fall gewinnt Hero $5. Wenn Villain nicht raist, dann gewinnt Hero $3.

      Hero limp/foldet K mit Wkt q2*(1-q3). Er verliert $1, wenn Villain raist und gewinnt $3 wenn Villain behind checkt.


      5. (Q,A)

      Hero kann den Pot nie gewinnen, wenn er limpt. Also wird er Q mit der Wahrscheinlichkeit q4 raisen. Da Villain immer callt, verliert Hero dann $3.

      6. (Q,K)

      Hero raist mit Wkt. q4 und Villain callt K mit Wkt. p1. Dann verliert Hero $3.
      Villain foldet K mit Wkt. 1-p1. Dann gewinnt Hero $3.

      Daraus folgt:

      6*EV=$5*((1-q1)*p1+q1*(1-p2)+q2*q3*(1-p2))+
      $3*(q1+(1-q1)*(1-p1)+q1*p2+1-q1-q2*q3+q2*q3*p2+q2*(1-q3)*p2+q4*(2*p1-1)-q4)-
      $1*(q2*(1-q3)+q2*(1-q3)*(1-p2))

      =p1*(5-5*q1+3*q1-3+6*q4)+
      p2*(-5*q1-5*q2*q3+3*q1+3*q2*q3+3*q2*(1-q3)+q2*(1-q3))+
      5*q1+5*q2*q3-3*q4+3*q1+3*(1-q1)+3*(1-q1)-3*q2*q3-3*q4-q2*(1-q3)-q2*(1-q3)

      Damit haben wir:

      3*EV=p1*(1-q1+3*q4)+
      p2*(-q1-3*q2*q3+2*q2)+
      q1+2*q2*q3-3*q4-q2+3


      Wegen q1<=1 und q4>=0 ist 1-q1+3*q4>=0.
      Wollen wir völlig unabhängig davon sein, wie oft Villain mit seinem K
      callt, müßten wir also q1=1 und q4=0 wählen, d.h. wir spielen limp/call A und folden immer Q.

      In diesem Fall wäre

      3*EV=p2*(-1-3*q2*q3+2*q2)+2*q2*q3-q2+4

      GTO wäre hier:

      q2=1/(2-3*q3)
      Wenn wir also K immer limpen, dann sollten wir q3=1/3 wählen.
      Limpen wir K weniger dann sollten wir auch weniger limp/callen.
      Die untere Grenze ist q2=0.5. In dem Fall muß man K immer limp/folden.

      Wie oft soll K gelimpt werden?
      Hierzu maximiere den "Rest" 2*q2*q3-q2 unter der Bedingung GTO, d.h.
      q3=(2*q2-1)/(3*q2)

      Wir müssen also f(q2)=2*(2*q2-1)/(3*q2)-1=(q2-2)/(3*q2) ---> max im Intervall I=(0.5,1)
      Da f in I streng monoton wachsend ist, muß q2=1 sein.

      Damit wäre eine GTO-Lösung für SB:

      A- limp/call
      K- limp/call in 1 von 3 Fällen, sonst limp/fold
      Q- fold

      Wir suchen noch eine GTO-Lösung für BB.

      Es gibt wieder 6 gleichwahrscheinliche Fälle, die zum EV wie folgt beitragen:

      1. (A,K)

      (1-q1)*p1*(-2)

      2. (A,Q)

      q1*(1-p2)*(-2)

      3. (K,A)

      6*q2*q3+4*q2*(1-q3)+3*(1-q2)

      4. (K,Q)

      (-2)*q2*q3*(1-p2)+4*q2*(1-q3)*(1-p2)

      5. (Q,A)

      3*(1-q4)+6*q4

      6. (Q,K)

      3*(1-q4)+6*q4*p1

      Damit bekommen wir den EV

      6*EV=2*q1*(p1-1+p2)+q2*(5-4*q3-4*p2+6*q3*p2)+6*q4*p1-2*p1+9

      GTO wäre auf jeden Fall p1=0, weil dann 6*q4*p1=0. Natürlich verzichten wir damit auf Gewinne aus dem Call von Bluffraises von SB. Interessanterweise ist es aber für SB GTO, Q nie zu bluffraisen, so daß man das auch als eine sinnvolle Adaption auf eine GTO von SB sehen kann.

      Dann ist der EV:
      6*EV=2*q1*(-1+p2)+q2*(5-4*q3-4*p2+6*q3*p2)+9

      GTO in Bezug auf die Wahrscheinlichkeit, daß SB A limp/callt ist also außerdem p2=1, d.h. wir checken Q immer behind und bluffraisen Q nie. Damit hätten wir dann

      6*EV=q2*(1+2*q3)+9

      Anders kommen wir nicht zu einer GTO, denn wenn wir ein p2 verschieden von 1 wählen, hängt der EV von q1 und q3 ab, also davon, wie oft Villain A limp/callt und K nach einem Limp callt.

      Lösung für BB:

      A - raise bzw. call to raise
      K - check behind und fold to raise
      Q- check behind und fold to raise

      Ich denke das ist nachvollziehbar und richtig.
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      und auch das ist nicht alles gto, weil l/f den l/c dominiert.
    • Marvl
      Marvl
      Bronze
      Dabei seit: 12.03.2005 Beiträge: 3.556
      sieht so aus, wenn BB's Lösung darin besteht, die Q immer behind zu checken.

      Was ich bis jetzt nicht verstanden habe:
      werden SB's A- und Q-Raise-Frequenzen in einer Variablen zusammengefasst, nämlich p4?
      Falls ja, darf man das?
      Kommt mir grad irgendwie verdächtig vor...
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Ich sehe ehrlich gesagt keine Dominanz. Wir limp/callen K ja auch deshalb in einem Drittel der Fälle, weil es sich für Villain sonst lohnen würde Q zu bluffraisen. Hat hazz doch vorhin selber geschrieben. Wenn mehr als ein 1/3 der Limps ein K ist und K immer foldet, ist das ein easy Bluffraise für BB, weil er mit 2:1 Odds nur 33% braucht. Oder was? Es würde also exploitbar sein, wenn wir K immer limp/folden.

      Was die Raises angeht, habe ich alles fein säuberlich getrennt:
      SB raist A mit Wkt. 1-q1 und er raist Q mit Wahrscheinlichkeit q4.
    • Marvl
      Marvl
      Bronze
      Dabei seit: 12.03.2005 Beiträge: 3.556
      Ach herrje, im Eingangspost sah es irgendwie so aus als bezögen sich q1 bis q4 auf die Reaktionen vom BB. ?(
      Naja, egal.

      Was die Dominanz betrift:

      Ein Merkmal von GTO ist doch, dass wir die Strategie nicht exploiten können, selbst wenn wir sie kennen.
      Sobald wir die für BB vorgeschlagene Strategie, Q immer behind zu checken, kennen, wissen wir, dass limp/fold besser als limp/call ist.
      limp/fold ist also eine dominante Option, falls BB's Strategie optimal ist, ansonsten ein Exploit.
    • SanWogi
      SanWogi
      Bronze
      Dabei seit: 02.07.2008 Beiträge: 2.259
      Ja stimmt. Im Eingangspost hatte ich q für BB verwendet und p für SB.

      Irgendwie zweifle ich gerade an meiner Methode, GTO auszurechnen.
      Es gibt zum Glücknoch eine andere Methode und zwar Fictitious Play. Bei Fictitious play startet man mit einer reinen Strategie und Villain wählt die beste reine Strategie gegen die gemischte Strategie, welche die Kombination der vorangegangen reinen Strategien von Hero ist.
      Eine reine Strategie für SB wäre z.B. (raise A, limp/call K, fold Q) bzw. q=(0,1,1,0)
      Eine reine Strategie für BB wäre z.B. (raise oder call A, check behind or fold K, check behind or fold Q) bzw. p=(0,1).
      Jede der Strategien hat einen bestimmten EV gegen eine gegnerische Strategie, so daß wir eine Payoff-Matrix erhalten.
      Ordnen wir alle sinnvollen reinen Strategien lexikographisch, so bekommen wir eine 8x4 Matrix.

      Villain spielt also in jedem Zug die jeweils beste reine Strategie gegen die gemischte Strategie von Hero. Und umgekehrt geschieht dies genauso, so daß wir die nötige History aufbauen können, um letztendlich eine optimale gemischte Strategie beiderseits zu finden, die nicht weiter exploitet werden kann.

      Hero und Villain exploiten sich also so lange gegenseitig, bis sie sich nicht mehr exploiten können und dann haben wir eine spieltheoretisch optimale Strategie für beide gefunden.

      Leider kann ich das hier nicht vorrechnen, weil es sehr mühsam ist, im Forum Matrizen aufzuschreiben. Jedenfalls kommt folgendes heraus:

      1.) Wenden wir fictitious play auf das Eingangsbeispiel an, so erhalten wir exakt die selbe Strategie für SB, die ich oben ausgerechnet habe.

      2.) Für BB ist die optimale Strategie allerdings anders, als von mir oben ausgerechnet. Vielleicht habe ich mich oben irgendwo vertan.
      Man sollte laut Fictitious Play als BB Q in einem von 3 Fällen bluffraisen.

      Und das ist eigentlich auch unmittelbar einsichtig. SB limp/callt in einem von 3 Fällen mit K während BB in einem von 3 Fällen mit Q bluffraist. Dann ist die Welt doch wieder in Ordnung, oder?
    • 1
    • 2