Ab wievielen Händen werden Stats aussagekräftig?!

    • JollyRoger183
      JollyRoger183
      Bronze
      Dabei seit: 03.02.2007 Beiträge: 8.874
      Ab wieviel Hands werden/sind Stats zuverlässig?

      Dieser Post ist erst einmal eine Rohfassung, die je nachdem welche Anmerkungen ihr habt und welche Passagen als zu kompliziert, schlecht oder falsch von euch angesehen werden noch weiter verändert bzw. verbessert.
      Bei manchen Punkten und Abschnitten bin ich mir selbst nicht 100% sicher und hoffe deshalb auf eine fruchtbare Diskussion und konstruktive Kritik eurerseits. Aber lest selbst worum es geht.
      _______________________________________________________________________________

      Einleitung

      Hurra! Hurra! Die PTPA-Lizenzen sind da. Endlich hat man STATS und READS auf die Gegner.
      Aber wie genau und zuverlässig sind diese VPIP und WTS-Werte. Kann man ab 50 hands schon sagen wer ne Calling Station ist und ab wann ein AFT wirklich Aggressivität repräsentiert?

      Neulich im Forum: Ein Spieler diskutiert eine Line und gibt als Hinweis den AF am Turn an mit 3,0 und das, obwohl er erst 21 Hände von diesem Spieler hatte. (Villain hatten den Turn in diesem Fall also vielleicht gerade 3 mal gesehen).

      Wer kennt sie nicht, die Szenen aus dem Coaching wo die Highroller sekundenlang mit der Maus über die Stats des Gegners kreisen um zu überlegen, ob der hier aggressiv genug ist um einen Draw zu raisen... und dann guckt man in die Ecke und sieht 23 hands :D
      Reicht das bereits um von Tendenzen zu sprechen?.

      In diesem Thread will ich mal versuchen mit dem Wissen, das ich über Statistiken besitze solche Frage mathematisch zu klären.

      Ich konzentrier mich dabei hauptsächlich auf VPIP, PFR, WTS und AFT.
      Bitte lest den thread aufmerksam und kritisch durch, da es mir vor allem um Richtigkeit geht und ich gerne zu Diskussionen bereit bin.

      Stats vs. Reads

      Vorab folgendes: Kombi hat glaube ich mal zwischen einem Read und stats unterschieden und auch ich bin der Meinung, dass es immer besser ist die Gegner intensiv zu beobachten um Reads auf sie zu entwickeln. Denn wenn man einen Gegner mal beobachtet hat, dass er mit A-high oder bottum pair downcalled, dann ist dieser Read viel mehr Wert als ein Stats-WTS-Wert von 38, 43, oder 48.
      Wenn man HU von einem Gegner mal mit Midpair am Turn ge3-bettet wurde kann man sich viel sicherer über dessen Aggresivität sein. Interessant finde ich es dann immer diese Spielweise mit den PA-Stats zu vergleichen um dann mehr oder weniger überrascht festzustellen, dass der Gegner die Werte 60/18/1,2/37 hat. Natürlich wissen wir wie TAG-Stats auszusehen haben und können die Gegnern aufgrund von Abweichungen von diesen "optimalen“ Werten in Kategorien stecken nach denen wir unsere Spielweise ausrichten.
      Nichtsdestotrotz sitzen wir auch mal neu an einem Tisch, oder es kommt ein Spieler frisch dazu mit dem wir noch keine Hand zusammen gespielt haben. Hier würden wir doch trotzdem gern wissen mit welchen Händen er ein PF-Raise macht um entsprechend zu reagieren. Hilft uns dabei ein PFR-Wert von 5 wenn wir gerade mal 40 Hände dieses Gegners haben?

      Aber kommen wir zur statistischen Aussagekraft von Stats.
      Mir geht es im folgenden darum zu klären wie wahrscheinlich es ist, dass man von einem Gegner nach 50 Händen einen VPIP oder WTS-Wert hat, der vom wahren Wert des Gegners abweicht. Also ob man Villain vielleicht nach 50 hands tatsächlich schon zuverlässig einordnen kann oder ob und wieweit man nur von Tendenzen reden sollte.


      Statistische Grundbegriffe und deren Bedeutung

      Lasst mich zuerst die folgenden statistischen Begriffe anhand von Beispielen erklären.
      Sample(size), Population, Durchschnitt und Standardabweichung.
      Stellt euch vor eine Firma stellt Glühbirnen (sagen wir 100.000 in der Woche) her und möchte wissen wie lange diese im Durchschnitt brennen. Diese Anzahl stellt die Population dar (Gesamtheit des Produkts bzw. der abstrakten Größe, wenn wir zum Pokern und VPIP usw. kommen). Am besten kann man die Lebensdauer natürlich feststellen, wenn man alle Birnen testet, dann hätte man allerdings keine mehr zu verkaufen. Deshalb wird nur ein Sample von 10 ausgewählt und getestet. Stellt euch vor man erhält die folgenden Tage Brenndauer (10, 9, 8, 9, 11, 3, 12, 10, 11, 8). Im Schnitt brennen die Birnen als 9,1 Tage und eine ging bereits nach 3 Tagen kaputt. Ist es jetzt möglich zu sagen inwieweit dies auch auf die anderen 100.000 Birnen zutreffen wird. Die Standardabweichung ist übrigens 2,5 Tage und ist ein Maß darüber wie weit die einzelnen Werte von dem Durchschnitt entfernt sind. Wie wahrscheinlich ist es, dass eine Birne mal nur 3 oder 5 Tage brennt? Kann man pauschal sagen, das 90% der Birnen zwischen 8 und 12 Tagen brennen?
      Ist es also möglich Daten von dem Sample auf die Population auszuweiten.

      Bezogen auf Pokern bedeutet das, dass ein Spieler sich einen gewissen Spielstil angeeignet hat, der, wenn er 100.000 Hände spielt ihm einen bestimmten VPIP/PFR/AFT und WTS einbringen wird.
      Nun werde ich beantworten was passiert, wenn ihr von diesem Spieler nur 10 Hände hättet und wie wahrscheinlich es ist seine wahre Spielweise an diesen Stats wiederzuerkennen.

      Nun handelt es sich bei Werten wie PFR und WTS nicht um quantitative Werte die kontinuierlich größer oder kleiner werden können, sonder um qualitative Werte die sich in Kategorien einordnen lassen. Entwerder erhöht man PF oder nicht – also ja oder nein. Entweder man geht zum SD oder nicht. Für diese Kategorien gelten die gleichen Regeln, was Sample, Durchschnitt und Standardabweichung angeht, man muss nur anders Rechnen. Bei den Glühbirnen addiert man ja alle Werte und teilt durch die Anzahl.
      Wenn ihr jetzt aber in Deutschland 20 Leute fragt ob sie Arbeit haben oder Arbeitslos sind, dann könnt ihr nur die Kategorien erfassen und wenn 2 Leute mit nein geantwortet haben sagen: 10% sind arbeitslos.
      Mit welcher Wahrscheinlichkeit kann man das aber auf ganz Deutschland übertragen?

      Ich hoffe ihr habt so ein bisschen ein Gefühl bekommen, so dass ihr die Ausführungen zum Pokern jetzt nachvollziehen könnt.


      Berechung des VPIP-Bereichs

      Beginnen wir mit dem VPIP, als der Frage, ob wir vor dem Flop freiwillig Geld in den Pot investieren. Es gibt also die 2 Kategorien "JA“ (Geld investiert) und "NEIN“ (folden, oder check im BB). Hier müssen wir bereits die erste Vereinfachung treffen, denn theoretisch könnte man auch weiter ins Detail gehen und fragen VPIP von MP2 aus, oder VPIP wenn vor einem einer geraised hat. Stellt euch vor ein Maniac sitzt rechts von euch und raist jedes mal, das reduziert die Hände die man selbst gespielt hätte drastisch und so kann man auch mal über 20-30 Hände einen völlig anderen VPIP haben. Gleiches gilt, wenn vor einem immer alle Limpen, oder wenn man einfach nur sehr gute Karten bekommt, oder sehr schlechte.
      Wir vereinfachen also auf Durchschnittsgegner, ~Karten und ~Positionen.
      Schauen wir uns also mal an, was passiert, wenn wir zufällig eine bestimmte Anzahl von Händen spielen und betrachten wie groß der VPIP ist.
      Die Abweichung von unserem wahren VPIP geht im Grunde auf 2 Größen zurück.
      Eine ist der VPIP selbst (also die Verteilung der Kategorien - ja/nein) und die andere ist die Samplegröße (Anzahl der Hände).
      Ganz klar ist, wenn man von den 100k Händen die wir schon gespielt hat 100k auswählt dann ist der VPIP-sample gleich dem VPIP-population (wahrer VPIP). Auch bei 10k hands Samplesize erwartet man bis auf einige Nachkommastellen eine Übereinstimmung.
      Was aber, wenn wir nur 10 Hände haben?
      Vorerst zum ersten Punkt. Die Abweichungen werden erheblich vom VPIP selbst bestimmt. Hier mal die zwei Extrema. Wenn ein Rock nur 10% VPIP hat, dann ist es sehr unwahrscheinlich, dass dieser bei 30 Händen auf einmal 10 Hände oder mehr gespielt hat und einen VPIP-sample von 33 oder größer aufweißt.
      Genauso ein Maniac – wenn jemand 90% seiner Hände spielt, dann muss es schon mit dem Teufel zugehen, wenn bei ihm nach 20 Händen ein VPIP-sample von 22 auftaucht und wir ihn fälschlicher Weise für einen Tag halten.
      Merke: Je extremer die Verteilung um so schneller wird sie mit der wahren Verteilung übereinstimmen.
      Anders sieht es da bei LAGs aus und Calling Stations. Wenn ein Spieler 45% seiner Hände spielt, kann die Abweichung schon recht schnell in die eine oder andere Richtung gehen.

      Aber kommen wir zur Mathematik:

      Immer wenn wir eine Hand halten müssen wir uns entscheiden ob wir (A) freiwillig Geld PF investieren (also limp or raise) oder (B) folden bzw im BB checken.
      Vom Gegner kennen wir die folgende Werte: VPIP = X und Handanzahl = Y.
      Es interessiert uns mit welcher Wahrscheinlichkeit der VPIP dieser Handanzahl dem wahren VPIP entspricht.


      Dafür gibt es folgende Formel:
      Standardfehler (SE) von Proportionen (also der Verteilung/Verhältnis aus (A) und (B)] = Wurzel aus [(VPIP * nichtVPIP) / Y]

      VPIP * nichtVPIP beschreibt das Verhältnis aus (A) und (B). Dies ist wie vorher beschrieben um so größer je weiter der VPIP von den beiden Extremen (Rock – Maniac) abweicht.

      Beispiel: VPIP 22 – Hands 30.
      Die Normalverteilung wird erst erreicht, wenn man bei den Samples (also die Anzahl von Händen, die man von der unendlichen Anzahl der Hände der Population auswählt) mindestens 30 Hände auswählt. Weniger als 30 kann zu sehr großen Missverständnissen führen.

      Ergebnis: SE = Wurzel[(0,22 * 0,78) / 30] = 0,076
      Was sagt uns das?

      Das bedeutet, dass wenn der VPIP eines Spielers von dem man 30 Hände kennt 22 ist, dass dieser einen Standardfehler von 7,6 besitzt. Der Standardfehler lässt sich übrigens aus der Standardabweichung ableiten, worauf ich hier aber nicht weiter eingehen möchte.

      Dies bedeutet, dass der wahre VPIP dieses Spielers mit einer Wahrscheinlichkeit von 68% zwischen 22 +-7,6 also 14,4 und 29,6 liegt.
      Ebenso ist es zu 32% sicher, dass der VPIP des Spielers entweder höher oder niedriger ist.

      Wie sieht es aus für einen Spieler mit VPIP 60 nach 30 Händen.

      Hier ergibt sich 8,9 als SE. Wie gesagt, je mehr der VPIP in der Mitte liegt desto größer die Abweichung.
      Allerdings kann man den Spieler schon recht gut charakterisieren, wenn man sich zu 68% sicher sein kann dass er 51,1 bis 68,9 VPIP hat. Trotzdem gilt auch hier, dass sein VPIP zu 32% größer oder kleiner ist.

      Wie kann man die Sicherheit über den wahren VPIP erhöhen und die Abweichung also SE reduzieren.
      Nun die nächsten Schranken wären z.B. 95% Sicherheit, oder gar 99% Sicherheit. Dazu müsste man SE ver-2-bzw.-ver-2,5-fachen.
      In dem Beispiel von eben würde gelten:
      Wir können uns zu 99% sicher sein, dass der wahre VPIP eines Spielers mit dem Wert VPIP=60 nach 30 Händen zwischen 2,5 * 8,9 +- 60 liegt, also von 37,75 und 82,25 liegt. Dieser Spieler ist also garantiert kein Rock oder TAG.

      Jetzt mag einer sagen – gut wir sind uns also extrem sicher, dass wir von dem wahren VPIP richtig weit entfernt sind.
      Allerdings hat dieser Spieler nach 30 Händen bereits mit fast 100%iger Sicherheit den Stempel Fisch verdient, denn wer kann denn selbst mit VPIP 37 +EV Poker spielen.

      Den gleichen SE erhält man übrigens auch für einen Spieler mit VPIP 40 (da 0,6 * 0,4 =0,4 * 0,6). Dieser Spieler bewegt sich allerdings mit 95% in den Schranken: 22,2 bis 62,2.

      Wie kann man nun die Abweichungen reduzieren. Es bleibt allein die Samplesize übrig und da von dieser in der Gleichung die Wurzel gezogen wird muss sie sich schon erheblich ändern um SE merklich zu reduzieren.

      Festhalten kann man vorerst, dass man nach 30 Händen in Punkto VPIP auf jeden Fall Tendenzen verzeichnen kann, denn 68% Sicherheit ist besser als pures Raten.
      Zum Beispiel wäre der 50% Sicherheitsintervall für den VPIP=40 Typ nach 30 Händen folgender: SE war 8,9 und VPIP 40  zu 50% liegt der wahre VPIP in den Grenzen VPIP-samp +- 0,7*8,9 also zwichen 33,8 und 46,2 mit 50% liegt er aber auch drüber oder drunter. Wenn ihr also einen Gegne seht der nach 30 Händen einen VPIP von 40 hat, dann könnt ihr guten gewissens Raten (was ja 50% entspricht), dass sein wahrer VPIP in den oben erwähnten Bereich liegt, oder aber nicht. Und bitte macht nicht den Fehler und denkt, "gut der Bereich ist von 31,1 bis 48,9, aber der VPIP der da steht ist 40, von daher wird der wahre VPIP schon näher an der 40 liegen, als an 32 oder 48“ Dies ist jedoch falsch, alles was ihr wirklich sagen könnt ist, dass ihr euch zu 68% sicher seid, dass der VPIP eben in diesem Bereich liegt.
      Ich denke, dass der 68%-Bereich bereits dem, was man eine Tendenz nennen kann nahe kommt. Den 95% Bereich hab ich aber ebenfalls integriert.

      Tabelle mit VPIP-Bereichen

      Es folgen die Ergebnisse für einen Rock, TAG, LAG/CS, und Maniac (bzw. die VPIPs von 15, 24, 30, 40, 50 und 60).

      Sowie jeweils die Sicherheit für 68% und 95% bei 30, 50, 100, 300 und 1000 Händen.

      Hände_____VPIP (mit Range darunter) der Bereich der zu 68% sicher ist

      __________15__________24:_________30____________40___________50_____________60
      30_____8,5 - 21,5___16,2 - 31,8___21,6 - 38,4___31,1 - 48,9__40,9 - 59,1____51,1 - 68,9

      50______10 - 20_____18 - 30_____23,5 - 36,5___33,1 - 46,9__42,9 - 57,1____53,1 - 66,9

      100____11,4 - 18,6___19,7 - 28,3__25,4 - 34,6___35,1 - 44,9__45,0 - 55,0____55,1 - 64,9

      300____12,9 - 17,1___21,5 - 22,6__27,4 - 32,6___37,2 - 42,8__47,1 - 52,9____57,2 - 62,8

      1000___13,9 - 16,1___22,6 - 25,4__28,6 - 31,4___38,5 - 41,5__48,4 - 51,6____58,5 - 61,5

      Wenn ihr euch zu 95% sicher sein wollt müsst ihr den Bereich folgendermaßen ausweiten:

      Hände_____VPIP (mit Range darunter) der Bereich der zu 95% sicher ist

      __________15__________24___________30___________40___________50____________60
      30_____2,0 - 28,0____8,4 - 39,6___13,3 - 46,7___22,1 - 57,9___31,7 - 68,3__42,1 - 77,9

      50______4,9 - 25,1___11,9 - 36,1___17 - 43_____26,1 - 53,9____36 - 64_____46 - 74

      100_____8 - 22_____15,5 - 32,5____21 - 39______30 - 50______40 - 60_____50 - 70

      300_____11 - 19_____19 - 29______24,7 - 35,3___34,3 - 45,7___44 - 56_____54,3 - 65,7

      1000___12,7 - 17,3___21,3 - 26,7__27,1 - 32,9___36,9 - 43,1__46,8 - 53,2____56,9 - 63,1


      Nochmal zum Verständnis. Oben ist der wahre VPIP angegeben z.B. eine LAGs ____40____ je nachdem wieviel Hände ihr von ihm habt (linke Spalte 30/50/100/300/1000) werdet ihr zu 95% bei Pokerace einen Wert innerhalb des Bereiches 30 - 50 erhalten, wenn ihr gerade 100 Hände von ihm habt.

      [ Vielleicht schreib ich in Exel auch noch ein Programm, wo ihr einfach VPIP und Handanzahl eingebt und euch die Tabelle auspuckt, dieser Spieler hat zu so und soviel Prozent einen VPIP von bis so und so viel.... ] - also anders herum quasi.

      Nehmen wir mal ein paar Beispiele raus. Wenn ihr als TAGs eine Session von 300 hands spielt, dann wird euer VPIP mit einer Wahrscheinlichkeit von 95% zwischen 19,1 und 29,1 liegen. Das bedeutet aber auch, dass wenn ihre eine Liste von 100 known Spielern habt 5 von denen, obwohl sie TAGs sind, einen VPIP größer oder kleiner diesem Bereich haben werden. Ein Spieler mit VPIP 33 kann nach 300 Händen also immer noch mit einer geringen Wahrscheinlichkeit (ca. 1,5% ein TAG sein).

      Ein weiteres Beispiel: Ihr habt einen Gegner mit VPIP 31,2 nach 30 Händen. Wie ihr seht (oberste Zeile neben 30 Händen) liegen diese 31,2 VPIP sowohl im TAG-, im 30VPIP- als auch im 40VPIP-Bereich, und das selbst bei 68% Sicherheit. Ihr könnt so einen Spieler also nicht einmal tendenziell bzw. genau einer der 3 Gruppen zuordnen. Ihr wisst nur, dass es wahrscheinlich (mit 68% Sicherheit) kein Rock oder Maniac ist.


      Eine Hilfe dabei ist auch immer das Verhältnis aus VPIP und PFR, wir könnten nach 40 Händen und viel Glück auch mal einen VPIP von 40 oder 50 haben, aber dann wäre unser PFR nicht 18, sonder verhältnismäßig eben auch 36 oder 40.
      Wenn ein Gegner aber nach 40 Händen 50/12 hat, dann kann man den Fish-Stempel schonmal auf Stempelkissen stellen.

      Der PFR errechnet sich theoretisch genauso und ich werde auch noch Tabellen mit typischen PFR-Bereich erstellen.

      [Tabelle mit PFR-Bereichen... coming soon...]


      WentToShowdown und AggressionFactorTotal

      Wie sieht es aber mit WTS und AFT aus?
      Fakt ist, dass ein Spieler nur zum SD gehen kann wenn er den Flop sieht. Wenn ihr also 30 Hände von einem Spieler habt, der einen VPIP von 20 hat, dann wird dieser nur 6mal den Flop gesehen haben. Er hatte also nur 6 mal die Chance überhaupt bis zum SD zu gehen und einen WTS zu generieren.
      Es gilt aber immer noch, dass ein vernünftiger Wert erst ab einer Samplesize von 30 herstellbar ist. Um auf diese 30 Sample zu kommen könntet ihr theoretisch einfach den VPIP mit der Handanzahl multiplizieren. Um den WTS, und gleiches gilt auch für den AFT, eines Spielers also einigermaßen genau feststellen zu können muss gelten: Hände * VPIP > 30. Für einen Tag geht dies also ab 30/VPIP = Hände ab 30/0,24 = 125 Händen los. Wenn wir dann zu 34% bis zum SD gehen also das Verhältnis aus ja und nein = 0,34/0,64 ist, dann werden wir zu 68% einen Bereich von 25,4 bis 42,6 haben.
      Das heißt, wenn wir mehrere Sessions á 125 Händen spielen, dann sollten wir zu 68% WTS-Werte zwischen 25,4 und 42,6 erhalten. Relativ ernüchternd wie schwer es wird diesen Wert genau bei einem Gegner, von dem wir erst wenig Hände haben, voraus zu sagen.
      Für einen total loosen PF-Spieler würde gelten 30/VPIP = Hände ab 30/0,7 = 43. Die 30 Sample hättet ihr bei ihm also schon nach 43 Händen.
      Man darf also nicht pauschalisieren, ab wann Stats aussagekräftig sind. Wichtig ist, dass der Spieler 30mal die Chance hatte in eine der beiden Kategorien zu fallen.
      Wie man das ganze für den AFT aufschlüsselt hab ich noch nicht komplett durchdacht da sich dieser Wert ja aus (bet + raise / call) zusammensetzt. Wenn ihr dort also zu 50% aggressiv seid und bettet bzw. raist, dann würde sich ein ein Verhältnis von 50/50 = AFT von 1 ergeben. Wenn ein Tag Postflop von 100 Möglichkeiten 72 mal bettet oder raist und 28 mal called ergibt sich ein Verhältnis von 72/28 = 2,57. Diese 72/28 mal würden natürlich wieder in einem Bereich von +- einer SE, also zwischen 63/37 bis 81/19 liegen. Somit würde der AFT zwischen 1,7 und 4,2 schwanken und das nur für einen Sicherheitsbereich von 68%.
      Wieviele Hände braucht man für diesen Bereich wenigstens? Hier kommt positiver Weise hinzu, dass ein Spieler der den Flop sieht bis zu SD 3 mal die Möglichkeit hat Einfluss auf den AFT zu nehmen. Nämlich an Flop, Turn und River. Wie oft er diese Streets erreicht und eine Chance hat ein "Sample“ zu werden kann man vielleicht mit dem WTS abschätzen. Somit ist die Samplesize recht schnell größer als die für den puren WTS. Allerdings hab ich euch ja gezeigt wie schnell der AF zwischen 1,7 und 4,2 schwanken kann. Ihr solltet also bei 60 Händen noch nicht mutmaßen, ob ein Spieler mit 2,8 nun besonders aggressiv ist oder nicht.


      Das Zusammenwirken der Basicstats

      Abschließend noch folgende Punkte:
      Ihr dürft nicht anfangen Werte wie AFT und WTS als absolute Anzeiger einer Spielweise ansehen, sondern diese immer ins Verhältnis zum VPIP setzen.

      Die Mathematik behandelt ja jeden Spieler gleich. Und wenn jemand 60/12/1,0/38 hat, dann ist der nicht weniger aggressiv als wir. Der spielt ja fast 3mal soviel Hände und bettet und raist im Verhältnis so oft, wie er nur called. Da er am Flop aber auch nur zu 30% ein Paar trifft, und dieses aufgrund seiner großen PF-Range nicht immer das TP sein muss (wie es bei Tags aufgrund der Highcards) häufiger der Fall ist, wissen wir dass dieser Spieler auch mittelmäßige Hände relative "aggressiv“ spielt, so dass ein Raise von ihm am Turn nicht zwangsläufig besser als TP sein muss, nur weil er mit nem Read auf passiv abgestempelt ist.

      Ein weiterer Punkt, der beim Seminar lange diskutiert wurde war, welcher der folgenden spieler mehr Show-down-bound ist.

      A: 60/10/1,0/34
      B: 37/15/1,2/50

      Es ging im Seminar dabei ums PF-play und die Frage, mit welchen Händen man solch einen Limper Isolieren kann (wenn die Blinds tight sind und wir wirklich HU gegen diesen Spieler kommen.)

      Die Hauptaussage war, dass man einen Spieler der nur einen WTS von 37 hat Postflop auch mal von ner besseren Hand runter bekommt und die eigene Hand zum Isolieren deshalb nicht ganz so stark sein muss, wie gegen jemanden der nun, nachdem er gelimpt hat und den Flop sehen wird jedes zweite mal (WTS =50) bis zum SD geht.
      Da gab es dann eine Wortmeldung, dass der WTS doch mit dem VPIP zusammen hängt.
      Oberflächlich gesehen ist das eher falsch. Denn die Spieler A oder B haben ja bereits gelimped, so dass für diese Hand "ihr VPIP“ 100% ist, sie werden den Flop definitiv sehen. Und am Flop entscheidet allein der WTS wie SD-bound diese Spieler sind.
      Wenn man sich das ganze mehr im Detail anschaut erkennt man, dass ein Spieler, der 60% seiner Hände spielt eben auch mit sehr mittelmäßigen Händen, manchmal gar A-high bis zum SD geht. Denn er wird selten TP treffen, aber eben mit irgendwas jedes 3te mal zum SD kommen.
      Hingegen hat ein Spieler der nur ausgewählte Hände spielt, häufiger mal was gutes am Flop und so rechtfertigt es seinen hohen WTS auch wieder ein wenig.
      Zurück zum Seminar – die Frage war nun also welchen von beiden man mit welcher Handstärke isolieren sollte. Pauschal kann ich das nicht beantworten, aber ich denke, dass man gegen beide Gegnertypen mit ner madehand ne Valuebet am River (SD) hat. Der eine geht selten bis zum SD, aber im Verhältnis zu seiner weiten PF-Handrange eben auch mit mehr Trash. Und der andere geht häufig bis zum SD aber hat startet auch mit besseren Händen PF.
  • 23 Antworten
    • phizza
      phizza
      Black
      Dabei seit: 03.10.2006 Beiträge: 3.015
      ohne mir alles durchgelesen zu haben, du bist ein verdammter mathe/zahlen freak! :D
    • JollyRoger183
      JollyRoger183
      Bronze
      Dabei seit: 03.02.2007 Beiträge: 8.874
      Hey Phizza - kenn dich noch aus Berlin :)
      Jo das Thema hat mich schon ne Weile bewegt und da es immer wieder in Threads zu Diskussionen kommt wie sinnvoll es ist von einem Spieler Stats anzugeben, wo man erst X-viele Hände hat, dachte ich mir ich rechne mal ein wenig rum.
      Hab im Zuge meiner Diplomarbeit auch grad ein Statistikbuch gelesen wo ich sehr oft an Pokern und deren Anwendungen darauf nachgedacht habe.

      Hab den langen Text jetzt erstmal mit Überschriften aufgelockert. So sollte er sich leichter lesen lassen.
      Viel Mathematik steckt da nicht wirklich drin - aber hat schon ne Weile gedauert.

      Da bewundert man die Leute wie Firsttsunami und Co dann noch etwas mehr, wie sie jede Woche immer Seitenweise Lehrreichste Bsp.Hände zusammenschreiben.
    • phizza
      phizza
      Black
      Dabei seit: 03.10.2006 Beiträge: 3.015
      coole sache mit der diplomarbeit, was genau studierst du denn? ich werd mir das hier auf jeden fall noch durchlesen, mal sehen, wann ich es schaffe.

      kann mir gut vorstellen, dass da einiges an arbeit drin steckt, dafür haste erstma meinen respekt ;)
    • NoSekiller
      NoSekiller
      Bronze
      Dabei seit: 29.08.2006 Beiträge: 7.727
      sehr interessant! vorallem die VPIP-Tablle ;)
    • FjodorM
      FjodorM
      Bronze
      Dabei seit: 14.02.2006 Beiträge: 11.238
      Hab mir auch nicht alles durchgelesen, aber sieht nach einem sehr interessanten Post aus. Auch einige ps.de-Coaches sollten sich das mal zu Gemüte führen. Ich hab schon mehrfach in Videos gesehen daß da Moves mit einem WTS von 32% bei einem Gegner begründet werden, von dem sie gerade mal eine zweistellige Händezahl hatten.

      Edit: Hab den Artikel jetzt ganz gelesen und finde, der gehört nach minimalen Überarbeitungen in die Strategisektion. Nice work!
    • Publius
      Publius
      Bronze
      Dabei seit: 26.02.2006 Beiträge: 1.339
      Super! Danke!

      Schon in der gegenwärtigen Fassung eine Riesen-Sache. Gerade weil ich mich im Moment in das Spiel mit PT einarbeite. Dabei habe ich mir auch schon Gedanken zu solchen "Kleinigkeiten" wie Signifikanz gemacht aber bisher noch nicht so viel dazu gefunden.

      Etwas kontruktive Kritik: Bei den langen Textpassagen wäre eine stärkere Unterteilung mit Absätzen und Überschriften sicher hilfreich. Evtl. auch nummerierte Überschriften in der ersten Ebene.
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      top!

      ich sag mal mail an wishmaster at pokerstrategy dot com und nimm ein bisschen geld dafuer ;)


      PS: zum isobeispiel: den 60er wird man definitiv öfter isolieren. zum einen weil unsere range oefter über der benötigten eq liegt (seine range ist ja auch schlechter) und zum anderen, weil wir imo weniger EQ brauchen, da wir noch meh FE haben und unser gegner fitnfold spielt. vpip und wts hängen in dem sinne zusammen, dass sie etwas über die qualitaet seiner hand am SD aussagen - über sdbound entscheidet nur der wts, wie du richtig sagst.

      PPS: ein kleiner haken: wir sind uns bei einer samplesize N von einem 40%vpip zu xx% sicher, dass sie in dem bereich Y liegt -- das ist etwas anderes als dass wir uns eine tatsaechliche samplesize von unknown anschaun, die in dem bereich Y liegt und wir uns überlegen zu wieviel % der typ 40% vpip hat. denn dazu muessten wir erstmal eine grundannahme ueber die allgemeine verteilung von vpips klarwerden. gibts nur 1 40er auf 99 20er, dann wird unsere samplesize wohl eher ein ausrutscher der 20er sein als ausgerechnet der 40er. und eigentlich ist ja letzteres die frage, die wir uns wirklich stellen.
    • JollyRoger183
      JollyRoger183
      Bronze
      Dabei seit: 03.02.2007 Beiträge: 8.874
      Original von hazz
      top!

      ich sag mal mail an wishmaster at pokerstrategy dot com und nimm ein bisschen geld dafuer ;)
      Da wär mir ein private coaching fast lieber ;) - aber ne, ging mir vor allem darum das mal etwas zu durchleuchten, und ich hoffe es hilft manchen ps.lern.

      Danke auf jeden Fall für deine Anmerkungen und Hinweise, werde da am WE wenn ich mehr Zeit hab was zu schreiben.
    • Zocker007
      Zocker007
      Global
      Dabei seit: 20.04.2005 Beiträge: 1.776
      Macht es wirklich Sinn, Stats eine so große Bedeutung zuzumessen?

      Für eine Grundkategorisierung des Gegners okay. Aber um auszurechnen, ob man seinen Blind mit A7 oder vielleicht doch erst mit A8 defenden soll, halte ich sie für übertrieben.
      Denn das würde einen stereotypen Gegner vorausssetzen, der immer den selben Stiefel runterspielt.
      Es soll Gegner geben, die ihren Stil variieren und selbst wenn man "Normal-TAG" ist, hat man an loose-passiven Tables andere Stats als an tight-aggressiven.
      Zusätzlich ist der Mensch beispielsweise stimmungsabhängig. Was helfen mir die Stats wenn der passive Fisch plötzlich tiltet oder nach 100K Händen dazugelernt hat und den Stil wechselt?
    • NoSekiller
      NoSekiller
      Bronze
      Dabei seit: 29.08.2006 Beiträge: 7.727
      Original von Zocker007
      Macht es wirklich Sinn, Stats eine so große Bedeutung zuzumessen?

      Für eine Grundkategorisierung des Gegners okay. Aber um auszurechnen, ob man seinen Blind mit A7 oder vielleicht doch erst mit A8 defenden soll, halte ich sie für übertrieben.
      Denn das würde einen stereotypen Gegner vorausssetzen, der immer den selben Stiefel runterspielt.
      Es soll Gegner geben, die ihren Stil variieren und selbst wenn man "Normal-TAG" ist, hat man an loose-passiven Tables andere Stats als an tight-aggressiven.
      Zusätzlich ist der Mensch beispielsweise stimmungsabhängig. Was helfen mir die Stats wenn der passive Fisch plötzlich tiltet oder nach 100K Händen dazugelernt hat und den Stil wechselt?

      die Stats sind durchschnittswerte und wenn uns keine anderen Informationen vorliegen, müssen wir von diesen ausgehen.

      Klar können wir uns auf die Stats nicht komplett verlassen, aber wenn wir uns nicht sicher sind, was genau wir jetzt machen sollen (schon ab A7 oder erst ab A8 defenden?), können sie den letzten Ausschlag geben.

      Dass der Gegner nicht immer so spielt, wie seine Stats sagen ist egal, denn im Durchschnitt wird er es tun, vorrausgesetzt die Stats sind aussagekräftig, und das ist das entscheidende.
    • kombi
      kombi
      Bronze
      Dabei seit: 20.08.2006 Beiträge: 9.244
      Sehr schön, das wollte ich schon immer einmal wissen. :)

      Zum letzten Absatz. Generell ist die Interpretation von stats ja noch etwas anders als ihre Aussagekräftigkeit. Grundsätzlich interessiert uns nämlich nicht wie oft ein Spieler limpt, raist, zum Showdown geht oder Aggression zeigt, sondern viel mehr mit welchen Händen er das tut. Die richtige Interpretation ist daher manchmal schwierig und variiert je nach Gegner.
    • cjheigl
      cjheigl
      Moderator
      Moderator
      Dabei seit: 09.04.2006 Beiträge: 24.495
      Der Standardfehler ist eher problematisch bei niedrigen Werten und weniger bei hohen Werten. Angenommen, ich habe einen gemessenen VPIP von 10 und einen Standardfehler von 5. Es macht einen Riesenunterschied, ob der tatsächliche VPIP 5, 10 oder 15 ist. Ist jedoch der gemessene VPIP 90 und der Standardfehler 5, dann besteht zwischen tatsächlichen VPIPs von 85, 90 und 95 fast kein Unterschied. Das Verhältnis zwischen Standardfehler und Erwartungswert (SE/EV) misst das Gewicht, das dem Standardfehler beizumessen ist.

      Geht man von einem bestimmten Gewicht des Fehlers aus (Beispiel: der Fehler soll nicht mehr als 10% vom VPIP betragen), dann ergibt sich daraus, dass man für kleinere Schätzwerte kleinere Standardfehler als für grosse Schätzwerte benötigt. Das entspricht der Beobachtung, dass für grosse Werte schon eine geringe Anzahl von Händen eine brauchbare Annäherung liefern, kleine Werte aber viele Hände benötigen.

      Schätzwert..............benötigte Anzahl Hände...benötigte Hände
      (VPIP, PFR, usw).......10% Fehlertoleranz.........20% Fehlertoleranz

      5...............................1900........................................475
      10...............................900........................................225
      15...............................567........................................142
      20...............................400........................................100
      25...............................300..........................................75
      30...............................233..........................................59
      40...............................150..........................................38
      50...............................100..........................................25
      60.................................67..........................................17
      80.................................25............................................7

      Megafische erkennt man eben schnell.

      Wie liest man die Tabelle? Wenn jemand nach 25 Händen ein VPIP von 50 hat, dann kann man sich einigermassen sicher sein, dass sein wahres VPIP zwischen 40 und 60 liegt.

      Für den WtS dividiert man die Zahl der benötigten Hände durch VPIP, da WtS von gesehenen Flops ausgeht, und für deren Anzahl ist VPIP eine Näherung.

      Beispiel: Für einen TAG mit VPIP 25 hat man bei einem Wert von WtS 40 selbst nach 600 (=150 / 0,25) Händen noch eine Fehlerquote von +/- 4 auf den WtS. WtS konvergiert wirklich langsam.

      Für den Aggressionsfaktor muss man anders vorgehen, da der AF kein Prozentwert ist. Es gilt AF = (Bet + Raise)/Call. Der AF muss zuerst in einen prozentualen Wert umgerechnet werden. Es gilt Bet% + Raise% + Call% = 100%. Nennen wir Bet% + Raise% mal Aggression, dann ergibt sich die Tabelle

      AF................Aggression...............benötigte Zahl Aktionen....benötigte Aktionen
      .....................................................10% Fehlertoleranz..........20% Fehlertoleranz

      0,2....................16,7...........................500.................................125
      0,4....................28,6...........................250...................................63
      0,6....................37,4...........................168...................................42
      0,8....................44,4...........................125...................................32
      1,0....................50,0...........................100...................................25
      1,2....................54,6.............................84...................................21
      1,4....................58,5.............................71...................................18
      1,6....................61,5.............................63...................................16
      1,8....................64,1.............................56...................................14
      2,0....................66,7.............................50...................................13
      2,2....................69,0.............................45...................................12
      2,4....................70,4.............................42...................................11
      2,6....................72,5.............................38...................................10
      2,8....................73,5.............................36.....................................9
      3,0....................75,2.............................33.....................................9

      Von den Aktionen auf die benötigte Zahl von Händen zu kommen ist nicht ganz einfach, da weder Check noch Folds berücksichtigt werden und das Ganze auch noch von der Zahl der gesehenen Flops pro Hand abhängt. Als grobe Richtlinie mag diese Schätzung dienen:

      Anzahl benötigter Hände = Anzahl benötigter Aktionen / (4 * VPIP * WtS)
      VPIP dient als Näherung für die Zahl der gesehenen Flops und 4 * WtS als Näherung für die Zahl der Aktionen pro Hand nach gesehenem Flop.

      Beispiel: für einen TAG mit 24 VPIP AF 2,5 WtS 35 benötigt man etwa 119 Hände, um sich mit einer Genauigkeit von 10% über seinen AF sicher zu sein. D. h. sein wahrer AF liegt nach 119 Händen zwischen 2,25 und 2,75. Die Sache hat den kleinen Haken, dass man ca. 750 Hände braucht, um sein WtS auf 10% genau zu bestimmen.

      Zuverlässigkeit der Aussagen:

      Der Standardfehler beruht auf der einfachen Standardabweichung, das entspricht einer Sicherheit von ca. 68%. Für eine höhere Sicherheit von 95% bräuchte man einen Fehler, der auf der doppelten Standardabweichung beruht. Das steigert die Zahl der benötigten Hände enorm. Man kann dazu aber die obigen Tabellen verwenden, da der 10% Fehlertoleranzbereich im 68% Sicherheitsbereich der 95%igen Sicherheit für den 20% Fehlertoleranzbereich entspricht. Nach 300 Händen beispielweise kann man sich zu 95% sicher sein, dass bei einem gemessenen VPIP von 25 das wahre VPIP zwischen 20 und 30 liegt. Der Unterschied zwischen den Spalten in den Tabellen gibt also auch die Schnelligkeit der Konvergenz wieder.
    • MrQNo
      MrQNo
      Bronze
      Dabei seit: 30.09.2006 Beiträge: 1.767
      Ich habe mal ein OpenOffice-Spreadsheet mit diesen Formeln erstellt und auf http://www.qno.de/Poker/winningplayer.ods hochgeladen.

      Falls jemand nicht nur mit den Werten, sondern auch mit den Formeln spielen möchte: Das Passwort ist poker.
    • fallschirm
      fallschirm
      Bronze
      Dabei seit: 07.03.2005 Beiträge: 55
      danke für den sehr guten beitrag!
      wahrscheinlich bist du auch der einzige, der zuverlässige aussagen über die varianz von sngs machen kann.
      hab schon viele hier gefragt, aber keine weiss es genau.
      was kann man nach n sngs mit roi(x) für die zukunft aussagen?
    • cjheigl
      cjheigl
      Moderator
      Moderator
      Dabei seit: 09.04.2006 Beiträge: 24.495
      Du könntest mit dem z-Wert feststellen, wie wahrscheinlich du winning Player bist. Dazu benötigst du die Standardabweichung deiner Turniergewinne. Deine Gewinne normierst du mit Gewinn = (Auszahlung - buy in) / buy in. Das ist im Prinzip der ROI für jedes einzelne Turnier. Daraus berechnest du die Standardabweichung.

      Für den z-Wert nimmst du die Formel

      z = mittlerer ROI / Standardabweichung

      Der mittlere ROI ist der ROI(n), den du gemessen hast.

      Der z-Wert ergibt dann, wieviele Standardabweichungen dein Ergebnis abweicht von dem hypothetischen Fall, dass du ein break even Player wärst.

      Positive z sind eine Abweichung in die Gewinnzone, negative z eine Abweichung in die Verlustzone. Für die Wahrscheinlichkeit der Hypothese, dass dein Ergebnis immer noch innerhalb der Norm für einen break even Player liegt, gilt:

      z = 1 -> 33%
      z = 2 -> 5%
      z = 3 -> 0,3%
    • vanao
      vanao
      Bronze
      Dabei seit: 13.08.2006 Beiträge: 3.480
      Ich hab mal ne Frage

      Du schreibst: "Standardfehler (SE) von Proportionen (also der Verteilung/Verhältnis aus (A) und (B)] = Wurzel aus [(VPIP * nichtVPIP) / Y]"

      Das versteh ich nicht.
      Wie kommt das und wo hast Du diese Formel her?
      Gehst du davon aus, dass der VPIP normal verteilt ist? Wenn ja, wiso?
    • cjheigl
      cjheigl
      Moderator
      Moderator
      Dabei seit: 09.04.2006 Beiträge: 24.495
      Ich denke, die Rechnung geht nicht davon aus, dass der VPIP aller Spieler normal verteilt ist, sondern die Aktionen eines bestimmten Spielers mit dem Mittelwert seines VPIPs normalverteilt sind. Wir betrachten immer nur die Aktionen eines bestimmten Spielers, nicht der Gesamtheit aller Spieler.
    • schummelpilz
      schummelpilz
      Bronze
      Dabei seit: 12.01.2007 Beiträge: 786
      sehr schöner artikel jolly (mit ebenfalls sehr guten Ergänzungen von cjheigl)!
      das meiste war mir zwar schon klar, aber ihr habt euch ehct arbeit gemacht und das ganze toll aufbereitet!
      vielen dank
    • Kyroka
      Kyroka
      Bronze
      Dabei seit: 09.11.2006 Beiträge: 938
      60/0/0,3 behandele ich auch nach 10 Händen als das was er zu 99,9% ist: ein Vollfisch. Genauso bei 30/20/2 nach 10 Händen. 60/40/5 ist tricky.

      Bis man ständig die gleichen Gegner hat, braucht man das HUD eigentlich nur um Fische so schnell wie möglich zu identifizieren. Wenn man sich da ewig über die Samplesize Sorgen macht, ist der Fisch broke bis man anfängt ihn zu isolieren.

      Und 60/0/0,3 heißt nun mal auch, dass er nach 100k Händen eher 45 als 35% WTS haben wird. Selbst wenn da nach 10 Händen 30% steht, gehe ich eher von 40 aus :)

      PT sammelt eine Menge Daten. Dass ein einzelnes Datum nur langsam konvergiert ist sicherlich richtig, das heißt aber nur, dass man die Daten kombinieren muss, nicht dass man sich die Daten am besten erst ab 100 Händen anzeigen lässt. Das finde ich an dem (gelungenen!) Artikel irreführend.
    • 1
    • 2