Fictitious Play - Mathematics of Poker

    • ChaosKlamsi
      ChaosKlamsi
      Bronze
      Dabei seit: 12.05.2006 Beiträge: 667
      Hi Leute,
      also es geht um fictitious play um poker zu analysieren. Im speziellen NL Holdem im Push or Fold Modus. Wer Mathematics of Poker zur Hand hat, siehe Seite 130ff.
      Und zwar hab ich Fragen bzgl. der Konvergenz, im Buch steht nur was davon, dass dieser Algorithmus konvergiert. Aber nicht wann, warum, wie usw. :) Interessant ist halt ob er wirklich immer zum Gleichen Grenzwert konvergiert, und wenn ja wieso? Kann man das irgendwie beweisen? Habe auch den guten Freund Google länger befragt, habe aber leider nichts vernünftiges gefunden.


      Weiterhin hab ich dann mal angefangen das selber nachzurechnen und habe mit S=1 angefangen. Bei S=3 geht es bei mir schon schief und ich kann keine konvergenz entdecken, da ich mich immer im Kreis drehe.
      Also ich verfahre wie folgt:
      Da ab S=3 der Verteidiger foldet gilt p(Verteidiger foldet)([equity angreifer](2S) - (S-1/2)) + (1-p(Verteidiger foldet))(1,5) > 0
      dieses nach der equity für den angreifer umgestellt liefert:
      Equity> (S-1/2)/(2S) + 3*(p(Verteidiger foldet)-1)/(4S*p(Verteidiger foldet))
      für den Verteidiger gilt:
      equity > (S - 1)/(2S)

      Anhand dieser Equity errechne ich mit Hilfe des Equilators die jeweilige Range des Angreifers, bzw. Verteidigers. Aber sowohl bei S=3 und S=4 konvergiert dieses Verfahren bei mir nicht.
      Hab ich irgendwo nen groben denkfehler? Vielleicht kann mir ja irgendjemand dabei helfen. Würde mich freuen

      Falls mich jemand im Skype anschreiben möchte: klamsichaos

      Vielen Dank
      David

      ps: ich hoffe der Thread ist richtig hier, wenn nicht bitte verschieben :)
  • 8 Antworten
    • kombi
      kombi
      Bronze
      Dabei seit: 20.08.2006 Beiträge: 9.244
      Folgende Zeilen mit verminderter Konzentration meinerseits. Ich kann nicht für deren Richtigkeit garantieren. :)

      Original von ChaosKlamsi
      Da ab S=3 der Verteidiger foldet gilt
      p(Verteidiger foldet)([equity angreifer](2S) - (S-1/2)) + (1-p(Verteidiger foldet))(1,5) > 0
      Laut Buch gilt:

      (1-p(Verteidiger foldet)[(equity angreifer)(2S) - (s-1/2)] + p(Verteidiger foldet)*1,5 > 0.

      Das müsste nach umstellen

      EQ > (S-1/2)/(2S) - 3p(Verteidiger foldet)/[(4S)(1-p(Verteidiger foldet)]

      liefern?
    • kwasir11
      kwasir11
      Bronze
      Dabei seit: 20.12.2009 Beiträge: 149
      Habt ihr mal den Autor etc von dem Buch für mich? Klingt interessant =)
    • kombi
      kombi
      Bronze
      Dabei seit: 20.08.2006 Beiträge: 9.244
      http://www.amazon.com/Mathematics-Poker-Bill-Chen/dp/1886070253

      Wenn du etwas über Spieltheorie und Optimals Pokerspiel erfahren willst, dann ist es sehr empfehlenswert. Ansonsten eher nicht so. ;>
    • kwasir11
      kwasir11
      Bronze
      Dabei seit: 20.12.2009 Beiträge: 149
      Ja das ist genau das was ich suche. Habe zwar schon bisschen Spieltheorie gemacht, aber nicht mit Bezug auf Poker.

      Danke dir und schönes WE
    • ChaosKlamsi
      ChaosKlamsi
      Bronze
      Dabei seit: 12.05.2006 Beiträge: 667
      Original von kombi
      Folgende Zeilen mit verminderter Konzentration meinerseits. Ich kann nicht für deren Richtigkeit garantieren. :)

      Original von ChaosKlamsi
      Da ab S=3 der Verteidiger foldet gilt
      p(Verteidiger foldet)([equity angreifer](2S) - (S-1/2)) + (1-p(Verteidiger foldet))(1,5) > 0
      Laut Buch gilt:

      (1-p(Verteidiger foldet)[(equity angreifer)(2S) - (s-1/2)] + p(Verteidiger foldet)*1,5 > 0.

      Das müsste nach umstellen

      EQ > (S-1/2)/(2S) - 3p(Verteidiger foldet)/[(4S)(1-p(Verteidiger foldet)]

      liefern?
      Du hast natürlich recht, hab mich in der Formel verschrieben, sollte anstatt p(Verteidiger foldet) p(Verteidiger callt) heissen. Dann sind beide Rechnungen gleich :) Habs auch mit der richtigen Formel durchgerechnet, und habe dort nach wie vor das Problem.
      Danke aber für den Hinweis :)

      Kann mir sonst keiner weiterhelfen?

      LG und Danke
      David
    • kombi
      kombi
      Bronze
      Dabei seit: 20.08.2006 Beiträge: 9.244
      Ich schau am Mittwoch nochmal drüber.
    • kombi
      kombi
      Bronze
      Dabei seit: 20.08.2006 Beiträge: 9.244
      Hi, also ich hatte erst gedacht, dass man so etwas per Hand rechnen kann, aber erscheint mir jetzt nicht wirklich praktikabel. Wie hast du das Verfahren angewendet? Mit selbstgeschriebenen Programmen oder wolltest du per Hand rechnen?

      Denn per Hand ist recht es recht schwierig die Ranges in den Equilator einzugeben. Laut dem Buch ergibt sich die angepasste Strategie S_mixed aus der Gewichtung aus der neuen und der alten Strategie. D. h. wenn du in der alten Strategie K3s zu 100% openraisen solltest und nach der maximal exploitenden Strategie zu 0%, dann wäre die gemischte Strategie für den SB eine Mischung. Im 6. Iterationsschritt wäre das (1-1/6)*100% + 1/6 * 0% = 83% Openraise mit K3s. Und das muss man für jede Hand einzeln machen. Du erhälst einen Vektor mit allen möglichen Händen und wie oft der SB diese raist. Jetzt musst du die beste Calling Range des BB gegen diese Range finden. Wenn du die Range des SB dazu in den Equilator eingeben willst, stehst du vor dem Problem, dass du schlecht 87% für K3s etc eingeben kannst. Du kommst um ein Programm also nicht drumrum.

      Hast du es so gemacht? :)
    • ChaosKlamsi
      ChaosKlamsi
      Bronze
      Dabei seit: 12.05.2006 Beiträge: 667
      Sry, dass ich hier paar Tage nicht reingeschaut habe, und Danke für deine Mühen :)

      Das erklärt natürlich mein Problem, ich hatte das natürlich nicht mit den gemischten Strategien getan, sondern einfach nur per Hand die entsprechenden Ranges in den Equilator eingegeben.

      Danke auf jeden Fall