Optimale fold frequency

    • TheOneAndOnlyMarkus
      TheOneAndOnlyMarkus
      Bronze
      Dabei seit: 20.02.2006 Beiträge: 3.784
      Hi,

      ich mache für die Uni atm einen Vortrag über Strategy Evaluation im Kontext von Poker, also wie man Pokerstrategien bzw. die Stärke von Pokerbots bewerten kann. Nun habe ich in einem Paper etwas zur optimalen fold frequency gelesen. Angeblich soll die sich durch betsize/(potsize+betsize) berechnen lassen. Also wenn man z.B. einen pot von 8 SB hat und wir müssten noch 2 SB zahlen im weiterzuspielen so ergibt sich eine fold frequency von 0,2. Das würde bedeuten man muss die schlechtesten 20% aller möglichen Hände folden. Nun Frage ich mich aber wie die darauf kommen? Gibts da irgendwo Quellen wo man das nachlesen könnte? Ich habe da bisher nicht zu gefunden.

      Schönen Gruß
      Markus
  • 20 Antworten
    • TheOneAndOnlyMarkus
      TheOneAndOnlyMarkus
      Bronze
      Dabei seit: 20.02.2006 Beiträge: 3.784
      Ah, hab grad gesehn dass in mathamatics of poker was dazu steht. Wenn trotzdem noch jemand anmerkungen hat immer her damit ^^
    • Romeryo
      Romeryo
      Bronze
      Dabei seit: 21.10.2008 Beiträge: 12.600
      Naja, ich spiel meist nich mehr als 20% Hände in SNGs, was wohl heißt das ich ca. 80% folde :P
    • beg0r
      beg0r
      Bronze
      Dabei seit: 07.05.2006 Beiträge: 2.948
      zeig mal das paper^^
    • beg0r
      beg0r
      Bronze
      Dabei seit: 07.05.2006 Beiträge: 2.948
      Original von Romeryo
      Naja, ich spiel meist nich mehr als 20% Hände in SNGs, was wohl heißt das ich ca. 80% folde :P
      ne, das ganze trifft dann ja auch auf postflopentscheidungen zu... nehme ich mal an. aber irgendwie versteh ich das ganze noch nich... naja, hoffe wir kommen dem auf die schliche ;) ..

      ich hätte nich gedacht dass das in diesem beispiel bedeutet die 20% schlechtesten hände zu folden, außer natürlich, dass diese 20% tatsächlich zufällig genau die hände sind, bei der wir nicht genug equity zum callen haben. kann ich mir nich vorstellen, bin aber zu faul mal irgendwo durchzurechnen ;) ...

      oder hab ich was falsch verstanden???
    • hasufly
      hasufly
      Black
      Dabei seit: 01.12.2006 Beiträge: 7.371
      Original von Romeryo
      Naja, ich spiel meist nich mehr als 20% Hände in SNGs, was wohl heißt das ich ca. 80% folde :P
      [ ] fragestellung und kontext korrekt erfasst
    • Xybb
      Xybb
      Bronze
      Dabei seit: 12.05.2007 Beiträge: 8.134
      Erstmal sollte man klären was "optimal" bedeutet: Optimal bedeutet in diesem Zusammenhang eine nicht-exploitbare Strategie zu finden, sprich: Der Gegner kann durch seine Entscheidungen seinen EV nicht beeinflussen.

      Sklansky hat in seinem Buch "The Theory of Poker" ein Beispiel dazu gegeben:

      Angenommen wir befinden uns am River (bzw. nicht unbedingt auf Hold'em bezogen auf der letzten Street vor dem SD), der Pot ist 100$ und die Betsizes betragen 20$.

      Unser Gegner nimmt an, dass wir in einem von 3 Fällen foldet, wenn er bettet. Das heißt, wenn er blufft(sein Bluff ist immer eine Hand die 0% Equity gegen unsere Range hat oder wahlweise niemals den SD sieht auf einen Check) beträgt sein EV: (1x100$-2x20$)/3=20$/Hand. Der EV von c/f ist natürlich 0.

      Daraus folgt b>c/f. Unser Gegner exploitet also unsere Tendenz zu oft zu folden durch bluffbetten.

      Unsere Call:Fold Frequenz (in diesem Beispiel 2:1) ist also schonmal nicht optimal.

      Gut. Dann callen wir halten etwas mehr, d.h. folden weniger. Das heißt wir wollen mehr bluffen. Jetzt folden wir nur noch in einem von 7 Fällen. Was für einen EV hat jetzt Villains Bluff?

      EV(Bluff)=(1x100$-6x20$)/7=-20$/7= ~ -2,9$/Hand

      Nun ist c/f > b/f. Auch nicht das was wir wollen. Jetzt kann Villain einfach c/f spielen :f_cry: .

      Gut, dann sollten wir doch wieder etwas mehr folden... . Probieren wir mal folgende Frequenz: Wir folden in einem von 6 Fällen (sprich Odds Call:Fold = 5:1).

      EV(Bluff)=1x100$-5x20$=0$=EV(c/f)

      Perfekt, es ist für den Gegner egal ob er blufft oder einfach aufgibt, seine Entscheidung beläuft sich immer auf einen EV von 0. b/f=c/f.

      Das heißt: Optimal spielen wir in diesem Beispiel, wenn wir 1/6 Hände folden und 5/6 Hände callen => Call in 83,3% der Fälle, Fold in 16,7% der Fälle.

      So, das bringt uns aber nicht allgemeingültig weiter. Was fällt uns auf? 5:1... .5:1 sind genau die Odds, die Villain auf einen Bluff bekommt: Er setzt 20$ ein um 100$ zu gewinnen. Und genau das ist unsere Frequenz, in der wir callen sollten, wenn wir nicht exploitbar sein wollen.

      (Anmerkung: Villains optimale Blufffrequenz wäre hier 6:1, nämlich genau die Odds die er uns auf einen Call gibt, wir würden 20$ zahlen um 120$ zu callen, der EV unsererseits wäre jetzt ebenso 0 für c/c oder c/f.)

      Wichtig ist, das wir unsere Calls rein zufällig verteilen, sodass Villain überhaupt keine Ahnung haben darf, ob wir callen werden oder nicht. Ausserdem bringt uns eine optimale Call Frequenz anders als bei einem optimalen Bluff nicht automatisch in einen +EV Spot, würde unser Gegner z.B. nie bluffen hätten wir einen -EV Call, wenn wir callen obwohl wir GTO (=Game Theory Optimal) spielen.

      Wenn Villain selbst GTO blufft, ownt er uns natürlich trotzdem, dennoch verlieren wir weniger wenn wir selbst GTO spielen, als wenn wir von der GTO abweichen und er uns exploitet (wenn er weiterhin GTO spielt ist es vollkommen egal was wir machen).

      Weicht man selbst vom optimalen Spiel ab (was man fast immer macht und machen sollte), dann ist das zwar potentiell exploitable, aber man erzielt einen deutlich höheren Erwartungswert, solange wir in der Lage sind auf Exploits zu adapten.

      Falls etwas zu verwirrend war... fragt nicht nach, mein Kopf muss auch Spagat machen um das zu kapieren^^.
    • kombi
      kombi
      Bronze
      Dabei seit: 20.08.2006 Beiträge: 9.244
      Diese optimale Fold Frequency gilt aber lediglich HU am River bei ca. gleich starken Ranges. Wenn du einen Monsterdraw am Flop oder die Nuts am River hast, wärs alles andere als optimal jemals zu folden.

      Als Einstieg bietet sich neben The Mathematics of Poker ein Artikel von Bryce an: Understanding Game Theory and Hold'em
    • TheOneAndOnlyMarkus
      TheOneAndOnlyMarkus
      Bronze
      Dabei seit: 20.02.2006 Beiträge: 3.784
      Thx Xybb für das ausführliche Beispiel!

      @kombi: Es geht hier tatsächlich um eine HU Situation und die Ranges werden als zufällig verteilt angesehn, also passt dass =)
    • HamburgmeinePerle
      HamburgmeinePerle
      Bronze
      Dabei seit: 30.01.2009 Beiträge: 6.136
      Original von kombi
      Diese optimale Fold Frequency gilt aber lediglich HU am River bei ca. gleich starken Ranges. Wenn du einen Monsterdraw am Flop oder die Nuts am River hast, wärs alles andere als optimal jemals zu folden.

      Als Einstieg bietet sich neben The Mathematics of Poker ein Artikel von Bryce an: Understanding Game Theory and Hold'em
      der artikel ist absolut klasse!


      Hab ich das richtig verstanden:
      Angenommen es gibt keinen Rake und Trinkgeld oder ähnliches, dann kann man mit der GTO-Strategie niemals Verlust machen. Das hab ich soweit verstanden denke ich.

      Allerdings kann man mit der GTO-Strategie auch niemanden exploiten, wenn also einer 100% seiner Hände spielt und zu 100% mit diesen am SD ist (mit einem AF von 0), dann spielen wir trotzdem nur breakeven gegen ihn?

      Das ist natürlich ein abstraktes Beispiel, weil es diesen Gegner nicht geben wird und wir schnell merken würden, dass wir gegen ihn halt viel looser valuebetten werden als gegen einen "normalen" Spieler.

      Aber vom Prinzip stimmts doch, dass wir gegen ihn mit der GTO-Strategie nichts gewinnen können oder?


      Im drittletzten Absatz des 2+2-Artikels steht jedoch, dass die GTO-Strategie trotzdem in manchen Situationen zu Gewinn führen kann.
      Das hab ich nicht ganz verstanden.

      Heißt das, dass wir gegen jeden, der diese Strategie nicht spielt, auf Dauer trotzdem Geiwnn machen werden, weil es eben solche Situationen gibt, in denen wir auch mit der GTO-Strategie Gewinn machen?


      Das ganze Balancing ist ja praktisch die GTO-Strategie oder? Aber für was balancen wir eigentlich? Macht man das halt gegen unknown solange, bis man seine exploitable Leaks erkennt und dann adaptet man darauf oder?

      Aber gegen gute Spieler machen wir diese Balancing-Lines ja auch!? Was ist unser konkretes Ziel damit? Wir sagen halt, wir haben gegen den guten Spieler keine Edge und spielen GTO, um gegen ihn breakeven zu spielen und dann die anderen zu exploiten oder wie ist das zu verstehen? Oder warten wir dann halt auch hier auf Leaks von ihm, die wir exploiten und wenn er adaptet halt wieder readapten!?



      Also kurz: Wir spielen solange GTO, bis wir ein Leak beim Gegner gefunden haben und dann adapten wir darauf und exploiten ihn, bis er es merkt und auf unsere vom GTO abweichende Strategie readaptet und diese dann solange exploitet, bis wir wieder readapten.
      Derjenige, der schneller und besser adaptet wird gewinnen (von Tilt und ähnlichem abgesehen)?


      Ist das das Zielk auf den Highstakes?
    • beg0r
      beg0r
      Bronze
      Dabei seit: 07.05.2006 Beiträge: 2.948
      Angenommen es gibt keinen Rake und Trinkgeld oder ähnliches, dann kann man mit der GTO-Strategie niemals Verlust machen. Das hab ich soweit verstanden denke ich.
      das besondere an der GTO ist, dass man gegen sie bestenfalls breakeven spielt, nämlich wenn man ebenfalls nach GTO spielt. sobald einer dann von der GTO abweicht, macht er verlust.


      Allerdings kann man mit der GTO-Strategie auch niemanden exploiten, wenn also einer 100% seiner Hände spielt und zu 100% mit diesen am SD ist (mit einem AF von 0), dann spielen wir trotzdem nur breakeven gegen ihn?
      ich denke wir exploiten ihn nur nicht maximal, machen also nicht maximalen gewinn.


      Im drittletzten Absatz des 2+2-Artikels steht jedoch, dass die GTO-Strategie trotzdem in manchen Situationen zu Gewinn führen kann.
      Das hab ich nicht ganz verstanden.

      Heißt das, dass wir gegen jeden, der diese Strategie nicht spielt, auf Dauer trotzdem Geiwnn machen werden, weil es eben solche Situationen gibt, in denen wir auch mit der GTO-Strategie Gewinn machen?
      man gewinnt bestimmt noch jede menge mit der GTO, weil jede abweichung des gegners davon gewinn für dich bedeutet. und die gegner weichen ja quasi auf allen limits noch extrem davon ab.

      ich vermute sogar, dass die ganze ps.de strategie im großen und ganzen erstmal eine annäherung an die GTO ist. weiß aber nich so genau..


      Das ganze Balancing ist ja praktisch die GTO-Strategie oder? Aber für was balancen wir eigentlich? Macht man das halt gegen unknown solange, bis man seine exploitable Leaks erkennt und dann adaptet man darauf oder?
      was du mit balancing meinst versteh ich nich. aber ansonsten, jo, wenn wir gut sind, exploiten wir den gegner und weichen damit selbst von der GTO ab (und werden damit exploitbar ;) ).


      Aber gegen gute Spieler machen wir diese Balancing-Lines ja auch!? Was ist unser konkretes Ziel damit? Wir sagen halt, wir haben gegen den guten Spieler keine Edge und spielen GTO, um gegen ihn breakeven zu spielen und dann die anderen zu exploiten oder wie ist das zu verstehen? Oder warten wir dann halt auch hier auf Leaks von ihm, die wir exploiten und wenn er adaptet halt wieder readapten!?
      jeder hat leaks. was meinst du warum es selbst unter den besten pokerspielern noch ausnahmespieler gibt? (wehe jemand sagt varianz)


      Also kurz: Wir spielen solange GTO, bis wir ein Leak beim Gegner gefunden haben und dann adapten wir darauf und exploiten ihn, bis er es merkt und auf unsere vom GTO abweichende Strategie readaptet und diese dann solange exploitet, bis wir wieder readapten.
      Derjenige, der schneller und besser adaptet wird gewinnen (von Tilt und ähnlichem abgesehen)?
      joa! vielleicht etwas naiv formuliert, aber könnt man so sagen :p


      Ist das das Zielk auf den Highstakes?
      is das nich das ziel auf jedem limit?




      ps. bin mir nich sicher ob ich alles 100% verstanden hab
    • HamburgmeinePerle
      HamburgmeinePerle
      Bronze
      Dabei seit: 30.01.2009 Beiträge: 6.136
      @beg0r:


      ja, natürlich ist es auf jedem Limit das Ziel an die Gegner zu adapten.

      Aber auf den niedrigeren ist es halt so, dass die Gegner meistens immer gleich spielen (wenn sie nicht besoffen sind oder so und deswegen nen maniacstil anstatt nem LPA-Stil spielen) und ihre Spielweise nicht ändern.

      Aber darum gehts ja auf den höheren Limits, weil fast jeder valuebetten kann und tight spielen (mit tigh meine ich weniger als zB. 50 vpip^^).

      Also muss man sich an die Gegner anpassen. Das wird auf den niedrigen Loimits nicht gemacht, weil die Fische es nicht können bzw. daran denken es zu tun und die TAGs es dadurch nicht nötig haben, weil sie auch mit standardpoker Gewinn einfahren.



      Zum GTO:

      Das ist genau der Punkt, ob wir überhaupt Gewinn damit einfahren, wenn wir nur GTO spielen.

      Weil wenn wir zB. genau gemäß unserer Pot Odds bluffen, dann ist es egal, was der Gegner macht, sein EV ist immer 0. Das heißt, wir können nicht verlieren, was ja unser Ziel ist, weil wir davon, dass diese die richtige Line wählen werden, wenn wir nicht GTO spielen, unser exploitive Play also exploiten.


      Allerdings weichen wir ja gegen Callingstations und Rocks davon ab, weil wir gegen Callingstations weniger und gegen Rocks mehr als unseren Pot Odds entsprechend bluffen und deshalb zwar exploitbar sind, aber wir wissen, dass die Gegner unser exploitive Play nicht exploiten werden, weil der eine zu viel callt (-> weniger bluffen) und der andere zu wenig callt (-> mehr bluffen).


      Und das war meine Frage, weil wenn wir immer nach dem GTO spielen, dann ist es ja egal, was der Gegner macht, sein EV ist immer 0, im Beispiel bei bluffs. Das ist das, was wir gegen gute Gegner wollen, gegen schlechte aber definitiv vermeiden.


      Wird man also Winningplayer sein, wenn man immer nach dem GTO spielt und sich in keiner Weise an die Gegner anpasst (man muss auch bedenken, was das nach sich zieht, zB. dass man gegen einen Fisch genauso gleich viel valuebettet wie gegen einen TAG, was wir normalerweise nie machen würden. Als Anfänger lernt man hier, eine exploitbare Line zu spielen, auf die der Gegner aber nicht adapten kann, weil er zu dumm ist. Daran denkt man im ersten Moment wohl gar nicht).



      Und genau das meine ich auch mit Balancing. Wir spielen zB. call Flop raise Turn sowohl mit Madehands als auch mit Draws und ggf. purebluffs, sodass er nicht immer folden bzw. immer callen kann und uns damit exploiten.

      Wenn wir es aber genau so machen, wie wir es nach dem GTO sollten, dass es für Villain keinen Unterschied macht, ob er callen soll oder nicht, dann machen wir halt ach keinen Gewinn. Deshalb balancen wir ja gegen Fische nicht.
      Das habe ich mit Balancingin Bezug aufs GTO gemeint, ich hoffe, es ist jetzt verständlich!?





      Also, die hauptsächliche VFrage lautet:
      Wird man überhaupt Gewinn machen, wenn man nur GTO spielt, ohne jemals davon abzuweichen?
    • kombi
      kombi
      Bronze
      Dabei seit: 20.08.2006 Beiträge: 9.244
      Original von HamburgmeinePerle
      Also, die hauptsächliche VFrage lautet:
      Wird man überhaupt Gewinn machen, wenn man nur GTO spielt, ohne jemals davon abzuweichen?
      Normalerweise ja.

      Nur weil du den Gegner nicht exploitest, heißt das nicht, dass seine Fehler ihm keinen Verlust bringen. Bei einem zu tighten Gegner ist das leicht einzusehen. Jemand der nur AA spielt, wird mit dieser Hand zwar viel Gewinn machen, dafür wird ihm mit KK, AQs einiges an möglichem Gewinn durch die Lappen gehen und wegen der Blinds macht er overall Verlust. Aber auch zu loose Gegner werden longterm gegen dich verlieren. Es mag zwar sein, dass deine Fold Frequency zB am River so gewählt ist, dass Villan indifferent zwischen bluffen und nicht bluffen ist, aber das heißt nicht, dass er 72o break even spielen kann. Immerhin muss er es mit der Hand erstmal bis zum River schaffen. Das heißt er muss erst einen Pot aufbauen, auf den er dann break even bluffen kann. Von dem Pot hat er die Hälfte aber selbst eingezahlt, so dass sein Move über alle Streets betrachtet -EV ist.
    • HamburgmeinePerle
      HamburgmeinePerle
      Bronze
      Dabei seit: 30.01.2009 Beiträge: 6.136
      Original von kombi
      Original von HamburgmeinePerle
      Also, die hauptsächliche VFrage lautet:
      Wird man überhaupt Gewinn machen, wenn man nur GTO spielt, ohne jemals davon abzuweichen?
      Normalerweise ja.

      Nur weil du den Gegner nicht exploitest, heißt das nicht, dass seine Fehler ihm keinen Verlust bringen. Bei einem zu tighten Gegner ist das leicht einzusehen. Jemand der nur AA spielt, wird mit dieser Hand zwar viel Gewinn machen, dafür wird ihm mit KK, AQs einiges an möglichem Gewinn durch die Lappen gehen und wegen der Blinds macht er overall Verlust. Aber auch zu loose Gegner werden longterm gegen dich verlieren. Es mag zwar sein, dass deine Fold Frequency zB am River so gewählt ist, dass Villan indifferent zwischen bluffen und nicht bluffen ist, aber das heißt nicht, dass er 72o break even spielen kann. Immerhin muss er es mit der Hand erstmal bis zum River schaffen. Das heißt er muss erst einen Pot aufbauen, auf den er dann break even bluffen kann. Von dem Pot hat er die Hälfte aber selbst eingezahlt, so dass sein Move über alle Streets betrachtet -EV ist.

      das ist n gutes Argument ;)


      Preflop ist natürlich entscheidend, weil wir da nicht balancen, da wir -EV-Hände gar nicht erst nicht spielen, ich glaube das war mein Denkfehler.


      Dann müsste das auch immer gelten, auch für nicht so extreme Beispiele oder? Also gerade wenn jemand preflop nen Fehler macht, kann er den ja nicht mehr kompensieren, da er postflop maximal breakeven gegen uns spielt und da seine Hände im Vergleich zu unseren schlechter sind, macht er auf Dauer Verlust...


      Wie ist es denn, wenn er preflop absolut genau gleich spielt wie wir, postflop aber deutlich schlechter? Werden wir dann Gewinn machen, wenn wir genau nach GTO spielen?


      Dann ja eigentlich logischerweise nicht, wenn wir an Flop, Turn und River usere Lines genau balancen oder?

      Ich denke, das wird praktisch wohl nicht möglich sein, so zu spilen bzw. überhaupt in so ne Situation zu kommen, um exakt nach dem GTO spielen zu können.


      ABER WENN ES MÖGLICH WÄRE,
      ist es dann so, dass wir gegen den Gegner genau breakeven spielen, wenn wir preflop genau gleich spielen und wir postflop genau nach GTO?


      Ich entferne mich grade zwar weit von der Praxis, meine Argumente basieren natürlich auf abstrakten Annahmen, aber ich will wissen, ob ich es jetzt verstanden habe!?



      In dem 2+2-Artikel steht ja auch, dass es Situationen gibt, in denen wir zwangsläufig Gewinn machen, wenn wir genau nach GTO spielen, weil unsere Range an manchen Stellen einfach so stark ist, dass Villain immer folden müsste, da wir gar nicht genügend Bluffs in unserer Range haben, um ihn zu einem korrekten call zu bewegen und somit natürlich trotzdem immer betten werden, um möglichst nahe ans GTO zu kommen, auch wenn wir es nicht erreichen werden. Damit foldet Villain zu 100% und in den Fällen, in denen wir nen bluff haben machen wir Gewinn (wenn ich das am Ende des Artikels richtig verstanden habe??!)


      Wenn wir diese Situation mal außen vor lassen, gilt dann das was ich gesagt habe, also, dass villain bei exakt gleicher prefloptheorie breakeven gegen uns spielt, wenn wir genau nach GTO spielen, und villain dabei so schlecht spielen kann wie er will?




      Während ich das schreibe, merke ich, dass es halt völlig realitätsfern ist, so zu denken, weil wenn villain dann mit der schlechtesten Hand seiner range immer runtercallt, dann haben wir ja gar keine Hände mehr, um ihn zu bluffen :(



      trotzdem, es geht mir ums prinzip, wie gesagt? Wär schön, wenn jemand dazu trotzdem was sagen könnte, auch wenn die Denkweise abstrakt ist.
    • beg0r
      beg0r
      Bronze
      Dabei seit: 07.05.2006 Beiträge: 2.948
      also nochmal kurz und knapp. du gewinnst mit der GTO immer wenn der gegner selbst davon abweicht. wenn der gegner breakeven spielen will, das bestmögliche ergebnis gegen die GTO, muss er selbst GTO spielen.
    • Xaor
      Xaor
      Bronze
      Dabei seit: 20.12.2007 Beiträge: 268
      @ HamburgmeinePerle und beg0r

      Man unterscheidet dominierte und nichtdominierte Fehler.

      Ein dominierter Fehler ist es eine Strategie zu spielen, die ein optimal spielender Spieler nie spielen würde. Zum beispiel könnte das gto sein in einer Riversituation mit einer bestimmten Hand in 15% Der Fälle zu callen und in 85% zu raisen aber nie zu folden.
      Hier wäre es ein dominierter Fehler diese Hand in der Situation zu folden. Ein nichtdominierter Fehler wäre es z.B. immer zu callen (oder alternativ raisen).


      Macht der Gegner dominierten Fehler wird der optimal spielende Spieler Gewinn machen. Ansonsten nicht.

      Dazu noch ein kleine Anmerkung. Es ist nicht ohne weiteres möglich keine nichtdominierten Strategien zu spielen. Es gibt einen Wettbewerb bei dem Bots (die versuchen möglichst nahe am gto zu sein) gegeneinanderspielen. Bei den Top bots ist der Unterschied vom Gewinn her etwa 0.010 Smallbets/game (also 1SB/100). Da die bots jeweils versuchen möglichst nahe am optimal play zu sein und keiner versucht den anderen zu exploiten ist diese Differenz etwa die Differenz an dominierten Fehlern der beiden Strategien.
      Wenn es einfach wäre ohne dominierte Fehler zu spielen würden alle guten Bots (in dieser Competiton) breakeven gegeneinander spielen.


      (Spielt man 3+handed so garantiert das/ein optimal play nicht, dass man breakeven oder +EV spielt.)

      Original von beg0r
      Also kurz: Wir spielen solange GTO, bis wir ein Leak beim Gegner gefunden haben und dann adapten wir darauf und exploiten ihn, bis er es merkt und auf unsere vom GTO abweichende Strategie readaptet und diese dann solange exploitet, bis wir wieder readapten.
      Derjenige, der schneller und besser adaptet wird gewinnen (von Tilt und ähnlichem abgesehen)?
      joa! vielleicht etwas naiv formuliert, aber könnt man so sagen :p
      Die Frage die sich stellt ist was besseres adapten heißt. Heißt das nur man versucht seinen EV gegen die Strategie die man beim Gegner vermutet zu maximieren? Da gibt es nur zwei Probleme.
      1.) Unsere Vorstellung der Gegnerischen Strategie könnte nur teilweise korrekt sein. "Harte Exploits" neigen dazu nur gegen ganz bestimmte Strategien einen hohen EV zu haben.
      2.) Angenommen wir exploiten den Gegner der sagen wir 1% zu wenig in einer Riversituation bluff damit, dass wir wesentlich mehr Hände folden als gegen einen Gegner der nach GTO spielt, so erhöhen wir unseren EV gegen diesen Gegner um einen kleinen Betrag. Adaptet der Gegner nun wieder und blufft etwas mehr so erhöht er seinen EV um einen viel größeren Betrag (ohne selbst sehr angreifbar zu werden).

      Wir müssen also vorsichtig adapten und dürfen z.B. keine zu harten exploits fahren. Dazu ein Graph:


      (Quelle: http://www.cs.ualberta.ca/~games/poker/papers/Papers/NIPS07-rnash.pdf)
    • NoSekiller
      NoSekiller
      Bronze
      Dabei seit: 29.08.2006 Beiträge: 7.727
      um noch mal drauf hinzuweisen (auch wenns Xaor irgendwo in seinem Post verwurschtelt hat^^):
      Wenn wir GTO spielen spielen wir (ohne Rake etc.) gegen JEDEN Gegner im HU mit einem EV >= 0. Das heisst, ganz egal was er macht...wir spielen entweder break-even oder machen Gewinnen gegen ihn.
      Es ist aber ein "irrglaube", dass wir nur break-even gegen ihn spielen, wenn er auch GTO spielt und sonst automatisch Gewinne machen. Es gibt auch Strategien, die gegen GTO break-even spielen, aber nicht GTO sind (der Unterschied ist, dass es Strategien gibt, die gegen diese wiederrum Gewinne machen würden, sprich sie sind exploitable).


      Lässt sich recht leicht an Schere-Stein-Papier zeigen:

      Die GTO von RPS (rocket-paper-siccors) ist logischerweise immer komplett zufällig eine der 3 Möglichkeiten zu wählen (sprich jede mit einer Wahrscheinlichkeit von exakt 1/3 = 33,periode3%).
      Das interessante an der RPS-GTO ist aber, dass sie nicht gegen jede Strategie einen EV >= 0, sondern einen EV von exkat 0 hat. Daraus folgt, dass es Strategien geben kann, die nicht GTO sind und trotzdem break-even gegen GTO spielen.
      Das ganze gilt natürlich dann auch für Poker und alle anderen Spiele.
    • HamburgmeinePerle
      HamburgmeinePerle
      Bronze
      Dabei seit: 30.01.2009 Beiträge: 6.136
      Original von NoSekiller
      Das ganze gilt natürlich dann auch für Poker und alle anderen Spiele.
      Für Schach nicht. Da ist die GTO-Strategie immer am besten und es gibt keine andere, die gegen sie "breakeven" spielen kann und nicht GTO ist!
    • Xybb
      Xybb
      Bronze
      Dabei seit: 12.05.2007 Beiträge: 8.134
      Original von HamburgmeinePerle
      Original von NoSekiller
      Das ganze gilt natürlich dann auch für Poker und alle anderen Spiele.
      Für Schach nicht. Da ist die GTO-Strategie immer am besten und es gibt keine andere, die gegen sie "breakeven" spielen kann und nicht GTO ist!
      Ich denke er meint alle Spiele ohne vollständige Informationen.
    • NoSekiller
      NoSekiller
      Bronze
      Dabei seit: 29.08.2006 Beiträge: 7.727
      Original von HamburgmeinePerle
      Original von NoSekiller
      Das ganze gilt natürlich dann auch für Poker und alle anderen Spiele.
      Für Schach nicht. Da ist die GTO-Strategie immer am besten und es gibt keine andere, die gegen sie "breakeven" spielen kann und nicht GTO ist!
      ich hatte kurz überlegt ob ich den Satz so stehen lasse...hätt ichs mal gleich anders formuliert:
      In der Theorie ist es möglich, dass es solche Strategien gibt, für manche Spiele kommen sie aber evtl. nicht vor...
    • 1
    • 2