Der Unterschied zwischen dem wahren $EV und dem von dem ICM geschätzten $EV

    • Bobbs
      Bobbs
      Bronze
      Dabei seit: 02.01.2006 Beiträge: 4.264
      Sammy meinte hier, dass an einer Verbesserung des ICMs gearbeitet wird. Deshalb hoffe ich durch einen Post hier Sammy und plexiq zu erreichen. Sammy weil er sich scheinbar dafür interessiert und plexiq, weil er den ICM Nash Calculator programmiert hat.

      Hier behauptet jemand, dass der Fehler des ICM durch außer Acht lassen der Positionierung der verschiedenen Stacks der $EV so groß wäre, dass die Hand ein Call wäre.

      Er versucht es damit zu belegen, dass das ICM nicht exakt ist und schon ein "kleiner " Fehler in der Schätzung der einzelnen Platzierungen ausreichen würde, um aus einem klaren Fold einen Call zu machen.
      Das ICM überschätzt deine Equity in dieser Situation, da es nicht mit einbezieht, dass der CL immer im BB ist, wenn du im SB bist und immer loose aus dem CO pusht, wenn du in den BB kommst.
      Der CL wird also wahrscheinlicher den ersten Platz erreichen als du.
      Die von dem ICM geschätzte Verteilung der Plätze habe ich weiter unten angegeben.

      Die Frage ist jetzt, wie groß der Fehler zwischen dem wahren $EV (t$EV) und dem von dem ICM geschätzten wirklich ist.

      Wäre er zum Beispiel größer als +-5%, wäre der Call mit AKo tatsächlich in Ordnung und das ICM hätte in dieser Situation klar versagt.

      Ich möchte mein Problem an dem Beispiel aus obigen Thread verdeutlich

      Beispiel(aus obigem Thread):
      Known players: (for a description of vp$ip, pfr, ats, folded bb, af, wts, wsd or hands click here)
      CO:
      6.170
      Hero:
      6.000
      BB:
      3.660
      SB:
      4.170

      No-Limit Hold'em Tournament ($22), Blinds 300/600 (4 handed)
      Hand recorder used for this poker hand: Texas Grabem 1.9 by www.pokerstrategy.com.

      Preflop: Hero is BU with K:heart: , A:club:
      CO bets to 6.170 (All-In), Hero raises to 6.000 (All-In), 2 folds.

      Flop: (912) A:heart: , T:spade: , 2:diamond:
      Turn: (912) 8:club:
      River: (912) T:club:


      Final Pot: 912.

      Das ICM schätzt die vermutlichen Platzierungen in dieser Situation als:

      --------- Chips W(1) W(2) W(3) $EV
      Player 1 6170.000000 0.3085 0.2826 0.2407 $57.43
      Player 2 6000.000000 0.3000 0.2801 0.2440 $56.56
      Player 3 4170.000000 0.2085 0.2291 0.2622 $45.08
      Player 4 3660.000000 0.1830 0.2083 0.2531 $40.92


      Und die Verteilung der Plätze für den Button bei einem Gewinn der Hand als:

      Player Chips Prob 1st Prob 2nd Prob 3rd Equity
      12170 0.6085 0.2966 0.0949 $82.44
      Nun hängt die Entscheidung ob Call oder Fold stark von den einzelnen Platzierungswahrscheinlichkeiten ab. Würde man noch öfter Zweiter werden als Dritter, so könnte man zu der Entscheidung "Call" gelangen.

      Ich gehe davon aus, dass der Fehler des Modells kleiner als 5% ist.
      Die Frage ist nun, wie man die Verteilung der Plätze besser schätzen könnte.

      Das ICM selbst benutzt die einzelnen Stacks der Spieler um deren vermutliche Platzierungsverteilung anhand ihrer Größe zu schätzen.

      Es gilt:
      Je genauer die Platzierungsverteilung geschätzt wird, desto geringer wird der Fehler zwischen t$EV und $EV.

      Wie könnte man nun den t$EV genauer schätzen als mit Hilfe des ICMs um ein Gefühl für die Größe des Fehlers zu bekommen?

      Meine Idee wäre es jetzt den t$EV ausgehend von einer gegebenen Situation mittels einer bestimmten Anzahl von "Simulationen" zu schätzen.

      Dabei mache ich folgende Annahme:
      Jeder Spieler spielt (nach dem Call/Push) mit den durch den Nash
      Calculator berechneten "perfekten" Ranges weiter.

      Nun könnte man eine Simulation konstruieren indem man so vorgeht:

      Zu einer gegeben Situation(etwa an der Bubble) schätzt man die Platzierungsverteilung nicht durch den Stack, sondern lässt die Spieler mit ab jetzt, durch Nash, perfekt gewählten Ranges gegeneinander antreten.
      Wir berechnen dann "genügend" oft den Ausgang des Turniers.
      In einer "Iteration" gehen wir so vor: (etwa bei obigen Beispiel)
      Berechne die Gewinnwahrscheinlichkeit von AK gegen die
      Pushingrange des Gegners.(~48% nach Nash, muss aber nicht nach
      Nash gewählt sein.)
      Berechne nun den $EV indem du die verschiedenen Fälle unterscheidest.
      Von nun an spiele weiter unter der Annahme, dass ab jetzt
      jeder die von Nash berechneten Range verwendet und verteile
      zufällige Karten.
      Mache dies, bis das Turnier zu Ende ist.

      Führt man diese Berechnung "genügend oft" durch, erhält man die benötigte Platzierungsverteilung der einzelnen Spieler um den t$EV zu schätzen.

      Ein Vergleich des $EV dieses Modells und des ICMs sollte etwas mehr Aufschluß über die Größenordnung des Fehlers des ICMs geben.

      Ist dieser Fehler groß, so ist das ICM in dieser Situation nicht in der Lage die Verteilung der Platzierungen gut genug zu schätzen und man sollte den durch die Simulation erhaltenen $EV Wert zur Berechnung der Range verwenden.

      Probleme hierbei sind folgende:
      Man müsste die UTG (bzw in Bubblesituationen CO) Ranges so anpassen,
      das auch looser gepusht wird, damit ein Ausblinden vermieden werden
      kann. Damit man von einem "vernünftigen" weiteren Spiel ausgehen
      kann.

      Daran arbeitet ihr gerade oder?
      Man muss nur beachten, dass man bei einem Fold den BB in der nächsten Hand an Equity im Stack verliert, aber auch nur 0,5BB(+Ante) gewinnt, wenn man pushed und alle folden.
      Sehe ich schon richtig oder?

      Ich denke, dass die Einbeziehung des Equityverlustes in der nächsten Runde die Schätzung der Platzierung durch eine Simulation wie oben beschrieben, die "wahren" Platzierungsverteilungen besser schätzen wird, als die Verwendung des ICM ohne eben diese in den einzelnen Simulationen.

      Die Rechenzeit steigt natürlich abhängig von der Anzahl der Iterationen
      stark an.

      Ist dies alles umsetzbar? Und wichtiger, seht ihr hier, wie ich, eine Verbesserung der Schätzung der Platzierungsverteilungen?

      Mfg,
      Bobbs
  • 16 Antworten
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.024
      Bzgl deiner Frage:
      Ich kann dir im Moment leider nicht beantworten wie groß der ICM Fehler hier ist, nichtmal per grober Schätzung. Wir haben bzgl. ICM-Verbesserungen zwar einige konkrete Ideen (geht in etwa in die Richtung die du vorschlägst), aber die Umsetzung wird wohl erst in etwa 1.5 Monaten starten.

      In der Hand sind die Blinds schon relativ hoch, dh das Game wird wohl nicht mehr sehr lange dauern. Je kürzer das Spiel, desto weniger wirkt sich der "Positions-Fehler" von ICM aus. Ich halte +/-5% rein gefühlsmäßig(!) für zu hoch geschätzt.

      Als Anhaltspunkt:

      Wenn alle Spieler nach Nash spielen, haben wir pro 1 Orbit folgende erwartete EQ-Änderungen:
      CO: +0.00738
      BU: -0.00031
      SB: -0.00514
      BB: -0.00192

      [Berechnung: Wir nehmen die derzeitigen Stacks, und berechnen für jede mögliche Position 1x das NE, und summieren die EQ-Änderungen. Das ganze ist natürlich nicht exakt, da in Wirklichkeit die erwarteten Stacks in 1, 2, 3,... Händen *nicht* gleich den derzeitigen Stacks sind. Aber als grobe Näherung sollte es langen.]

      Wir sehen, dass CO wie erwartet im Schnitt gut an EQ gewinnt. Wir verlieren pro Orbit zwar leicht an EQ, aber nicht annähernd so viel wie SB oder BB. Das deutet zumindest mal darauf hin. dass der ICM-Fehler für den BU hier relativ gering ist (<<5%) .
    • Jimjamaica
      Jimjamaica
      Bronze
      Dabei seit: 08.05.2006 Beiträge: 370
      Hallo Ihr Beiden,

      ich wollte, damit kein falscher Ausgangspunkt diskutiert wird, nur noch einmal sagen, warum ich den durch ICM berechneten $EV für fehlerbehaftet halte.

      streng mathematisch gesehen existiert auch kein wahrer EV, da wir es nicht mit einer konvergierenden Reihe zu tun haben, die möglichen Kartenverteilungen der folgenden Runden sind einfach zu groß.

      Der Fehler der Schätzung resultiert meiner Meinung nach aus der Tatsache, dass aus vorangegangenen Spielen (aktueller Chipstand) ein Ergebnis projiziert wird, ohne die zukünftigen Spiele zu berücksichtigen.

      Also ich sehe den Fehler nicht nur in der Nichtberücksichtigung der Position.

      Grüße
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.024
      Original von Jimjamaica
      Der Fehler der Schätzung resultiert meiner Meinung nach aus der Tatsache, dass aus vorangegangenen Spielen (aktueller Chipstand) ein Ergebnis projiziert wird, ohne die zukünftigen Spiele zu berücksichtigen.

      Also ich sehe den Fehler nicht nur in der Nichtberücksichtigung der Position.
      Grüße
      Wie du in den Näherungen oben siehst, ändert ein zusätzlicher "simulierter" Orbit aber wenig an der projizierten EQ des BU. Dh die ICM-Schätzung für den BU scheint zumindest einigermaßen konsistent zu sein. Anders als die EQ Schätzung der anderen Spieler btw.

      Hier gings nicht nur um die Position, sondern auch um die "zukünftigen Spiele", die du ansprichst.
    • Bobbs
      Bobbs
      Bronze
      Dabei seit: 02.01.2006 Beiträge: 4.264
      Original von plexiq
      Als Anhaltspunkt:

      Wenn alle Spieler nach Nash spielen, haben wir pro 1 Orbit folgende erwartete EQ-Änderungen:
      CO: +0.00738
      BU: -0.00031
      SB: -0.00514
      BB: -0.00192

      [Berechnung: Wir nehmen die derzeitigen Stacks, und berechnen für jede mögliche Position 1x das NE, und summieren die EQ-Änderungen. Das ganze ist natürlich nicht exakt, da in Wirklichkeit die erwarteten Stacks in 1, 2, 3,... Händen *nicht* gleich den derzeitigen Stacks sind. Aber als grobe Näherung sollte es langen.]
      Stimmt, obige Schätzung sollte die Größenordnung des Fehlers als "nicht zu groß" belegen können.

      Btw. interessante Posts in dem, im anderen Thread verlinkten, 2+2 Thread.

      @Jimjamaica
      Dass du den Fehler nicht nur in der Nichtberücksichtigung der Position siehst, ist sicher jedem klar, der den Thread gelesen hat.

      Es wäre interessant zu sehen, wie stark sich der geschätzte Erwartungswert von dem des ICMs unterscheidet, wenn man versuchen würde die Finish Distribution durch eine eine große Anzahl an Simulationen der weiteren Abläufe des Turniers zu schätzen.
    • Jimjamaica
      Jimjamaica
      Bronze
      Dabei seit: 08.05.2006 Beiträge: 370
      Hallo nochmal,

      nach einer mehr oder weniger schlaflosen Nacht hab ich, denk ich, jetzt die Lösung des Problems und der Fehler liegt hier ganz klar bei mir, da ich leider aus meiner Anzweifelung des geschätzten $EV die falschen Schlüsse gezogen habe.

      Es ist nämlich völlig unerheblich, wie groß der Fehler bei der Schätzung des $EV ist, da uns nur interessiert, wie groß ist der Fehler zwischen den Schätzungen vor und nach der gespielten Hand des $EV. Und da sich hier keine gravierenden Änderungen ergeben, ist der Fehler sehr klein und die 0,5% $EV Regel reicht vermutlich aus, diesen zu berücksichtigen!

      Es kommt also nicht auf den absoluten Fehler der Schätzung des $EV an sondern auf den relativen!

      Somit bleibt natürlich die ursprünglich diskutierte Hand ein Fold!


      Danke nochmals für die vielen Hinweise und zumindest mir hat die Diskussion ein großes Stück gebracht, weil bekanntlich lernt man ja aus Fehlern am meisten! :D

      Gute Hand und schönen Tag!
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.024
      Original von Jimjamaica
      Es ist nämlich völlig unerheblich, wie groß der Fehler bei der Schätzung des $EV ist, da uns nur interessiert, wie groß ist der Fehler zwischen den Schätzungen vor und nach der gespielten Hand des $EV. Und da sich hier keine gravierenden Änderungen ergeben, ist der Fehler sehr klein und die 0,5% $EV Regel reicht vermutlich aus, diesen zu berücksichtigen!
      kA ob du das ohnehin meinst, finde den Absatz ein wenig verwirrend :D Entscheidend für unsere Aktion ist das Verhältnis der Equity-Schätzungen der möglichen Ergebnisse dieser Hand. (EQ vor der Hand is irrelevant,..obv.)

      Wenn ICM die EQ für deinen "aktuellen" Stack (eigentlich: die EQ|Fold) grob überschätzen würde, die Equity nach einem Double-Up aber NICHT überschätzt, dann wäre das sehr wohl höchst relevant für unsere Entscheidung.

      In der konkreten Hand scheint die EQ für deinen aktuellen Stack aber relativ genau zu sein, und im Falle eines DoubleUps, ist der CO nächste Hand im BB a/i - dh du wirst nicht lange Zeit haben die Bubble zu abusen. Also dürfte der Fehler auch in diesem Fall überschaubar sein.
    • Jimjamaica
      Jimjamaica
      Bronze
      Dabei seit: 08.05.2006 Beiträge: 370
      also mein grundansatz war folgender:

      wenn der chipstack die verantwortliche größe für den $EV ist, so muss das immer so sein, wir können ja nicht mittedrin die spielregeln ändern. das würde aber bedeuten, dass alle spieler den gleichen $EV zu Beginn des spiels haben und wir bei unterstellung des idealen spielers(verhalten nach nash) aus unserem poker das von allen unterstellte reine glücksspiel machen.

      daraus resultiert meine annahme, dass der aus den chipsstacks geschätzte erwartungswert fehlerhaft sein muss und damit natürlich auch diffEV fehlerhaft.

      nun ist ja aber der relative fehler zwischen beiden ev schätzungen (vor und nach der hand) entscheidend und hier kann ich keinen groben fehler erkennen. auch wenn man rein mathematisch eine fehlerbehaftete größe (meine den absoluten fehler) nicht so einfach aus der rechnung herauskürzen kann, wie ich es mit dem geschätzten erwartungswert mache.

      also ist die equity schätzung entscheidend
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.024
      nun ist ja aber der relative fehler zwischen beiden ev schätzungen (vor und nach der hand) entscheidend und hier kann ich keinen groben fehler erkennen. auch wenn man rein mathematisch eine fehlerbehaftete größe (meine den absoluten fehler) nicht so einfach aus der rechnung herauskürzen kann, wie ich es mit dem geschätzten erwartungswert mache.
      Habs oben schonmal geschrieben, aber nochmal:
      Unsere Equity *vor* der Hand ist für die Entscheidung völlig irrelevant. Worauf wir angewiesen sind ist, dass die Equity Schätzungen für die möglichen Ergebnisse der Hand relativ zueinander konsistent sind. Da wir in dieser Situation auch mit Equity=0 vergleichen (wir können in dieser Hand "busten"), müssten die Equities für eine exakte Entscheidung sogar absolut gesehen korrekt sein.
    • Jimjamaica
      Jimjamaica
      Bronze
      Dabei seit: 08.05.2006 Beiträge: 370
      irre ich mich oder wird mein $EV bei fold nicht gleich meinem ev vor der hand? wird zumindest in der ps strategiesektion sng gold so dargelegt. von den blinds abgesehen bleibt der chipstack ja auch gleich. oder reden wir jetzt aneinander vorbei?
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.024
      Im Trainer, im ICM Nash Calculator, und auch in SnG Wiz (nicht! bei SnGPT) ist die EQ bei Fold *nicht* gleich der Equity mit derzeitigen Stacks.

      Wir sehen uns dabei an was unsere EQ am Ende der Hand ist, nachdem wir folden. Abhängig von den Ranges hinter uns erwarten wir ja, dass andere Spieler ab und zu a/i gehen, und diese Aktionen nach uns beeinflussen die EQ nach der Hand ganz entscheidend.

      Beispiel:
      4 Handed wir sind Midstack am BU und 2 Bigstacks in den Blinds. Wenn wir folden kann der SB weit pushen, und die Hand läuft mit einer nicht vernachlässigbaren Wahrscheinlichkeit auf ein all-in der beiden BigStacks hinaus. Wir gewinnen in diesem Fall sehr entscheidend an Equity. Die möglichen Aktionsfolgen hinter uns werden für die EQ|Fold sehr wohl berücksichtigt.
    • Jimjamaica
      Jimjamaica
      Bronze
      Dabei seit: 08.05.2006 Beiträge: 370
      in unserem beispiel pusht aber co, die blinds werden also folden außer es sitzt kk+ bzw aa in den blinds. daraus resultiert ja dann auch meine annahme.

      mein chef mein übrigens zum thema fehler, dass sich durch fehlerfortpflanzung die varianzen addieren, wir also selbst bei geringen relativen schätzfehlern des $ev einen einfluss haben.

      das wirft dann aber doch wieder die frage auf, wie genau ist die schätzung des erwarteten gewinnes auf grund der aktuellen chipsituation
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.024
      Die Blinds haben jedenfalls ne wesentlich größere Callrange als du. Abgesehn davon ergibt sich ein Unterschied auch dann, wenn alle Spieler folden - da der CO ja die Blinds kassiert.


      mein chef mein übrigens zum thema fehler, dass sich durch fehlerfortpflanzung die varianzen addieren, wir also selbst bei geringen relativen schätzfehlern des $ev einen einfluss haben.
      Kannst das bitte etwas genauer erläutern? Ich seh grad nicht worauf sich das bezieht. (Gut möglich dass ich vor lauter Bäumen den Wald nicht mehr seh, bitte in diesem Fall um Nachsicht :D )

      Vielleicht ne kleine Anmerkung am Rande, um meine Posts in ein etwas anderes Licht zu rücken: Ich bin durchaus kein riesen "Fan" von ICM, und es gibt massenhaft Situationen in denen man meiner Meinung nach von "ICM optimalem" Spiel abweichen sollte. Aber in dieser speziellen Situation seh ich einen Call isoliert betrachtet praktisch sicher als -$EV.
    • Jimjamaica
      Jimjamaica
      Bronze
      Dabei seit: 08.05.2006 Beiträge: 370
      da der $EV eine geschätzte größe ist (und auch wenn wir ihn über spiele auspielen), bekommen wir nur einen erwartungswert (daher ja der name :D ) gehen wir nun davon aus, dass der erwartungswert normalverteilt ist (unterstellung aber nach zentralem grenzwertsatz bei genügend großen versuchsreihen annähernd richtig) erhalten wir eine bestimmte streuung ausgedrückt über die standardabweichung bzw die varianz.

      addieren (oder auch subtrahieren) wir jetzt zwei erwartungswerte und somit auch ihre varianz erhalten wir quasi eine größere streuung unserer werte. dies hat dann natürlich insbesondere bei knappen entscheidungen einen einfluss
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.024
      Sorry, mir war im ersten Post nicht klar, worauf du dich eigentlich bezogen hast.

      Dh du willst annehmen, dass der ICM Schätzfehler normalverteilt ist?

      Nachdem wir die Erwartungswerte jeweils gewichtet nach der Auftritts-Wahrscheinlichkeit des jeweiligen Hand-Ergebnisses addieren, wird die Varianz unter der Annahme aber eigentlich kleiner, oder nicht?

      Wenn wir normalverteilte Schätzwerte haben, und wir eine gewichtete Summe daraus bilden, bei der alle Gewichte positiv sind, und die Summe der Gewichte 1 ergibt (wie das bei uns der Fall ist), dann ist die Standardabweichung/Varianz der gewichteten Summe kleiner als die maximale Standardabweichung/Varianz der beteiligten Schätzwerte.
    • Jimjamaica
      Jimjamaica
      Bronze
      Dabei seit: 08.05.2006 Beiträge: 370
      nein, ich meine der erwartungswert $ev ist nomalverteilt.

      im icm wird der wert mittels aktueller chipverteilung berechnet und das ist wie ja auch gesagt wird nur eine schätzung, für die ich bei großen versuchsreihen auf grund des zentralen grenzwertsatzes eine normalverteilung annehme.

      und wenn ich die normalverteilten erwartungswerte addiere, addieren sich die varianzen.
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.024
      Prinzipiell:
      Wenn ich normalverteilte Größen *gewichtet* addiere, alle Gewichte positiv sind und die Summe der Gewichte gleich 1 ist, ist die Varianz der Gewichteten Summe kleiner als die größte Varianz der aufsummierten Größen.

      Wir addieren hier immer gewichtet mit Gewichts-Summe 1, da wir jeweils mit der Auftrittswahrscheinlichkeit des jeweiligen Handausgangs multipliziern. [Dh selbst wenn es sich bei unsren $EV Werten um normalverteilte Größen handeln würde, würde sich durch das aufsummieren die Varianz *verkleinern*.]

      PS:
      Eine Normalverteilungsannahme für einen Erwartungswert ist - nett formuliert - "eigenartig"?! Der Erwartungswert ist jener Wert der bei oftmaligem Wiederholen des zugrunde liegenden Experiments als Mittelwert der Ergebnisse ergibt. Die (normierten) Summen eines genügend großen Samples(!) von identisch verteilten Zufallsvariablen sind normalverteilt, aber nicht der zugrunde liegende Erwartungswert der Zufallsvariablen(!!). Deine "Schlussfolgerung" hat nichts mit dem Zentralen Grenzwertsatz zu tun.