GTO

    • wuerstchenwilli
      wuerstchenwilli
      Black
      Dabei seit: 07.04.2008 Beiträge: 18.676
      Ich weiß zum hundertstenmal...

      Aber diesmal aus einer anderen (evtl. Nanis?!) Sichtweise betrachtet.

      Was bringt es mir zu 1/3 Schere, 1/3 Stein und 1/3 Papier zu spielen? klar! jemand der mich readet kann nicht gegen mich gewinnen. Aber das kein ein Affe, der immer nur Stein spielt (ja, ich meine den guten alten Stein), auch nicht. Aber ich gewinne auch gegen keinen von beiden. D.h. GTO ist doch immer nur BE oder? Wenn jemand eine GTO-Blufffrequenz hat am River, ist es egal was ich mache. Ich gewinne nicht. ich verliere aber auch nicht, wenn ich immer calle. Ergo calle ich immer und der GTO-Player muss erstmal adapten. oder vertue ich mich irgendwo?
  • 27 Antworten
    • sonnensb
      sonnensb
      Bronze
      Dabei seit: 21.03.2007 Beiträge: 2.545
      GTO ist nur dann immer BE, wenn die Gegner keinen einzigen dummen Fehler machen, so genannte dominierte Spielzüge. Ansonsten ist GTO >= 0.
    • Funkmaster
      Funkmaster
      Bronze
      Dabei seit: 30.04.2005 Beiträge: 4.073
      Original von sonnensb
      GTO ist nur dann immer BE, wenn die Gegner keinen einzigen dummen Fehler machen, so genannte dominierte Spielzüge. Ansonsten ist GTO >= 0.
      So habe ich das auch im Kopf. Gibt es irgendwo ein einfaches Pokerbeispiel, dass zeigt, dass eine GTO Strategie bei gegebener Strategie des Gegners +EV ist?
    • MyLady17
      MyLady17
      Black
      Dabei seit: 11.03.2007 Beiträge: 7.975
      GTO ist eben am besten gegen Leute die selbst keine erkennbare Schwäche haben.

      Ich versuche mein Spiel immer mit einer Analogie aus dem Boxsport zu erklären. Gegen unbekannte Spieler bin ich erstmal passiv (GTO) und hau nicht wie wild drauf los, wenn ich aber dann Schwächen in der Deckung erkenne (folded zu viel auf Cbets, checkt dauernd den Turn) greife ich diese an. GTO hilft mir nicht selbst dauernd Kinnhaken aus dem Nichts zu bekommen ;)
    • Alph0r
      Alph0r
      Black
      Dabei seit: 09.05.2007 Beiträge: 5.149
      Original von Funkmaster
      Original von sonnensb
      GTO ist nur dann immer BE, wenn die Gegner keinen einzigen dummen Fehler machen, so genannte dominierte Spielzüge. Ansonsten ist GTO >= 0.
      So habe ich das auch im Kopf. Gibt es irgendwo ein einfaches Pokerbeispiel, dass zeigt, dass eine GTO Strategie bei gegebener Strategie des Gegners +EV ist?
      SNG Push or Fold gegen Nits afaik
    • balrog25
      balrog25
      Silber
      Dabei seit: 03.11.2006 Beiträge: 656
      Original von wuerstchenwilli
      Ich weiß zum hundertstenmal...

      Aber diesmal aus einer anderen (evtl. Nanis?!) Sichtweise betrachtet.

      Was bringt es mir zu 1/3 Schere, 1/3 Stein und 1/3 Papier zu spielen? klar! jemand der mich readet kann nicht gegen mich gewinnen. Aber das kein ein Affe, der immer nur Stein spielt (ja, ich meine den guten alten Stein), auch nicht. Aber ich gewinne auch gegen keinen von beiden. D.h. GTO ist doch immer nur BE oder? Wenn jemand eine GTO-Blufffrequenz hat am River, ist es egal was ich mache. Ich gewinne nicht. ich verliere aber auch nicht, wenn ich immer calle. Ergo calle ich immer und der GTO-Player muss erstmal adapten. oder vertue ich mich irgendwo?
      Du vertust dich zum ende so ziemlich ueberall.

      Beim GTO ist der Exploit bereits eingebaut, d.h. wenn der Gegner vom GTO-Spieler kein GTO spielt, exploitet ersterer sich selbst. Der GTO Spieler muss also nicht gg dich adapten. D.h. In deinem poker-Bsp.: damit der GTO spieler dich mit seiner Bufffrequenz nicht exploitet, musst DU mit GTO callfrequenz adapten. callst du zu selten, exploiten dich seine Bluffs, callst du zu haeufig, exploitet dich seine valuerange, natuerlich je nach grad der abweichung mehr oder weniger stark. Im poker haengt die konkrete gto frequenz der einzelnen actions von den pot odds ab.

      Im Gegensatz zum exploitive ansatz "laesst" du als GTOler also (die anderen sich selbst - durch ihre leaks) exploiten, statt selbst aktiv zu exploiten. Gute exploitive spieler hingegen erkennen die leaks der gegner und erzielen hoehere WRs als GTO Spieler, weil sie je nach Gegnertendenz (sagen wir mal als Bsp ein Gegner bet/foldet zu 40% auf river checkraises) den Gegenmove in hoeherer Frequenz auspacken als nach GTO korrekt waere - in meinem bsp also statt gto bluff checkraise frequenz eine weitaus hoehere bluff checkraise frequenz.

      Der 40% bet/fold kann trotzdem ++EV sein, weil viele Gegner in dem Spot einfach sehr selten oder gar nie bluffen. Gg. Den GTOler ist diese Frequenz marginal -EV (da die GTO bluff xR frequenz am R tendenziell niedrig ist,aber hoeher als beim 0815 TAG), gg. einen Nani aber u.u. ---EV, weil der dieses leak erkennt und konsequent durch bluffs exploited, bis der gegner readapted.
    • Alph0r
      Alph0r
      Black
      Dabei seit: 09.05.2007 Beiträge: 5.149
      Es stimmt aber, dass in vereinfachten Value/Bluff vs. Bluffcatcher Games ein GTO Spieler keinen Gewinn machen kann. Die Praxis ist aber natürlich komplexer und es gibt genügend Situationen, in denen jemand eine dominierte Strategie spielen kann.

      Außerdem ist es so, dass reine exploit Strategien selbst gegen schlechte Gegner einen sehr stark negativen EV haben, falls der Gegner auf eine etwas andere Art schlecht ist, als wir es erwartet haben.

      Dass man mit genauen Reads exploiten sollte, ist eh klar.
    • wuerstchenwilli
      wuerstchenwilli
      Black
      Dabei seit: 07.04.2008 Beiträge: 18.676
      Original von Alph0r
      Es stimmt aber, dass in vereinfachten Value/Bluff vs. Bluffcatcher Games ein GTO Spieler keinen Gewinn machen kann.
      Das meine ich doch. Ist der pott am River 9 BB und Vilain sagt mir: "Hey, ich spiele GTO und bluffe hier zu 10%!" Dann kann ich doch immer callen und fare BE oder nicht?

      Und das Stein/Schere/Papier-Beispiel hinkt doch auch: Jemand der 1/3 1/3 1/3 spielt ist einer anderen Taktik doch nicht überlegen?!
    • Alph0r
      Alph0r
      Black
      Dabei seit: 09.05.2007 Beiträge: 5.149
      Ja, in den Fällen wirst du nichts gewinnen. Das sind aber auch extrem simple Games.

      Wenn in SNGs beide Spieler nach Nash pushen und callen, liegt der EV der Spieler um ca 0.1bb auseinander. Überleg dir mal, was passieren würde, wenn der BB zu 100% folden würde, der EV des SB wäre dann nah an 1BB/hand, da er fast immer shoven wird bei kleinen Stacksizes und dann immer den Blind gewinnt.

      Obv ist das ein extremes beispiel, aber es zeigt doch, dass Gegner immernoch Geld verlieren können. Falls der BB eine etwas realistischere Defending Range hat, die aber immernoch zu tight ist, wird er obv weniger verlieren, er wird aber dennoch einen negativen EV haben.
    • Pulow
      Pulow
      Bronze
      Dabei seit: 21.10.2006 Beiträge: 726
      der gewinn des GTO spielers gegen nicht gtoler entsteht dadurch, dass der in bestimmten spots einfach falsche ranges hat.

      einfaches beispiel wäre 100% openraise im ringgame. da kann der spieler dannach noch so gut spielen .. solange wir gegen den einen gto stiefel runter spielen werden wir gewinnen, weil der gegner viel zu viel aufgeben muss (er schlägt mit dein meisten händen nichtmal unsere bluffingrange). dass das den gegner nicht maximal exploitet sollte aber klar sein.

      gleiches gilt dann falls jemand grobe fehler auf dem flop macht .. denn das bestimmt seine turnrange .. und wenn er die schlechtere/ungünstigere range zum turn bringt müssen wir erstmal fehler machen, damit wir dadurch nicht automatisch gewinnen.
    • MyLady17
      MyLady17
      Black
      Dabei seit: 11.03.2007 Beiträge: 7.975
      richtig, daher ist es auch wichtig seine Preflop Ranges zu analysieren. GTO war u.a. der Grund für mich trotz damaliger Kritik von 25/19 auf 32/25 aufzuloosen
    • wuerstchenwilli
      wuerstchenwilli
      Black
      Dabei seit: 07.04.2008 Beiträge: 18.676
      Original von MyLady17
      richtig, daher ist es auch wichtig seine Preflop Ranges zu analysieren. GTO war u.a. der Grund für mich trotz damaliger Kritik von 25/19 auf 32/25 aufzuloosen
      Du verrücktes Huhn!
    • Tanzhase
      Tanzhase
      Black
      Dabei seit: 14.02.2006 Beiträge: 1.360
      Den EV holst du nur durch eine falsche Valuebetfrequenz beim Gegner.
    • MyLady17
      MyLady17
      Black
      Dabei seit: 11.03.2007 Beiträge: 7.975
      Original von wuerstchenwilli
      Original von MyLady17
      richtig, daher ist es auch wichtig seine Preflop Ranges zu analysieren. GTO war u.a. der Grund für mich trotz damaliger Kritik von 25/19 auf 32/25 aufzuloosen
      Du verrücktes Huhn!
      Inzwischen klingt es sicher lächerlich, aber damals haben die PS.de´ler fast alle 24/18 gespielt und alle andere wurde als blasphemisch abgetan ;)
    • Cornholio
      Cornholio
      Bronze
      Dabei seit: 05.02.2006 Beiträge: 25.674
      Und heute ist es andersrum :f_biggrin:
    • Wiseguy01
      Wiseguy01
      Bronze
      Dabei seit: 19.08.2009 Beiträge: 1.712
      Wie heisst es so schön. Den heiligen Gral gibt es nicht. Es gibt verschiedene Spielansätze, wichtig ist sie optimal auf den jeweiligen Gegner anzuwenden.
    • Ickki
      Ickki
      Bronze
      Dabei seit: 08.11.2010 Beiträge: 962
      Original von MyLady17
      richtig, daher ist es auch wichtig seine Preflop Ranges zu analysieren. GTO war u.a. der Grund für mich trotz damaliger Kritik von 25/19 auf 32/25 aufzuloosen
      Wieso ist 32/25 GTO? Pre-flop Ranges kann man doch bislang nicht optimal berechnen, dachte ich.
    • MyLady17
      MyLady17
      Black
      Dabei seit: 11.03.2007 Beiträge: 7.975
      Berechnen nicht, aber erfahrungsgemäß kommt man tighter zu oft in einen Bereich in dem zu wenig und bei looserem Spiel in einen Bereich bei dem zu viel geblufft wird.
    • Happa2
      Happa2
      Silber
      Dabei seit: 14.08.2010 Beiträge: 3.633
      Wäre es möglich Gto so zu berechnen dass man BB und SB als Ante sieht und man den Gegnern zb statt 10000 verschiedenen Ranges einfach mal 100 verschiedene Ranges gibt Angefangen mit paar extremen Ranges wie AA only und dann noch eine 100 Prozent Range und dann noch 98 etwas realistischere Dinger. Wenn man BB und Sb als Ante sehen würde wäre ja schon einmal klar woher unser Gewinn von den vielen Folds von dem AA-only Spieler käme. Wenn man den BB und Sb normal hat dann bringt uns ein Fold vom Button zb keinen unmittelbaren Profit. Von diesem Button werden wir erst einen Gewinn bekommen wenn er zu häufig seinen BB oder Sb foldet. Es ist klar, dass der Button Verlust macht wenn er zu Tight ist aber es wäre wichtig zu wissen für die postflop Analyse wie hoch dieser Verlust durch zu viele folds wäre vielleicht mit Hilfe von Datenbanken oder Erfahrungswerten?? Vllt ist das mit der Ante auch nicht so schlecht.....

      Die postflop Analyse würde dann so Vorgehen, dass man seine Strategie offenlegt diese kann aber Gewichtungen enthalten etc sie kann also flexibel sein und die gegnerische Range wird immer max ev gegen uns spielen uns also maximal exploiten.

      Die Strategie des Gegners wäre uns nicht bekannt aber wir kennen seine Möglichkeiten aufgrund der Möglichkeit dass er Betten Raisen Callen oder folden kann.

      Die Sache ist noch dass wir unsere Range gegen alle Gegner identisch spielen würden (aber mit Gewichtungen) wir. Würden sozusagen gegen jede Range des Gegners die gleichen Hände b/f oder b/c.

      Das führt uns zu der Schlussfolgerung, wenn der Gegner unsere Strategie vollkommen kennt also von Flop bis River (oder sogar Preflop) er einfach durch einen variantenbaum weiß was das beste für ihn ist.

      Die Verzweigungen des Baumes würden alle Möglichen Plays des Gegners berücksichtigen und unsere fixierte statische Strategie. Da wir immer gleich reagieren sind wir kein handelnder Spieler mehr in dem Sinne. Der gegnerische Spieler wird jetzt also uns, da er weiß wie wir spielen maximal exploiten und an den unteren Wurzeln des Baumes das Endergebnis wählen das am besten für ihn ist. Das Ergebnis kann zb in BB angegeben sein.
      Klar ist es schwierig eine optimale Strategie gegen eine statische Strategie zu finden aber ich denke eine Annäherung an das Optimum ist sehr wahrscheinlich.

      Dieses Vorgehen würde man dann auf allen möglichen Boards anwenden mit jeder möglichen Range die der Gegner am Flop halten könnte. Die Bedingung von Gto ist, dass man dagegen nicht gewinnen kann. Dh wenn unsere fixierte Strategie gegen alle möglichen Ranges die optimal gegen uns spielen auf allen möglichen Boards dem Gegner keinen Profit gibt nur durch Shortterm-Luck dadurch dass wir ein schlechtes Board Hitten zb dann spielen wir Gto.

      Jetzt stellt sich natürlich auch die Frage wie man zu dieser fixierten Strategie kommen könnte. Unsere Strategie ist auf jeden Fall an bestimmte Bedingungen geknüpft zb dürfen wir gegen eine bestimmte betsize nur eine bestimmte Prozentzahl an Händen folden, weil der Gegner bei zu vielen Folds autoprofit machen würde. Das heißt in vielen Spots können wir zb unsere maximale Check Folding Range ermitteln indem wir einfach die potgröße anschauen. Das gilt natürlich nur wenn wir Gto bis dahin gespielt haben.

      Das gute ist, dass wir in einem Spot auch die Gto-Spielweise ermitteln können und nicht mit unserer gesamten Strategie vergleichen müssen. Da jede cashgame-Hand unabhängig voneinander abläuft können wir einen Verlust in einem Spot mit einer Hand nicht so argumentieren, dass wir ja in einem anderen Spot so viel Gewinn machen würden. So können wir nur argumentieren im BB wo uns der Verlust aufgezwungen wird dieser gleicht sich aber aus durch die Gewinne in den anderen Positionen. Wir könnten auch einen Verlust rechtfertigen durch eine ungünstige Boardkonstellation dann müssten wir aber beweisen, dass das Gesamtergebnis wenn man alle möglichen Boardkonstellationen berücksichtigt nicht ins Negative geht.

      Der Rake ist auch noch eine Schwierigkeit. Wenn jeder Gto spielt macht jeder Verlust.
      Das heißt wenn jemand Zugang zur Gto Strategie hätte und ein anderer das wüsste dann könnte er einfach seine Strategie kopieren. Noch schlimmer noch: er könnte sie verbreiten und dann würde auf einmal jeder die Gto Strategie neben sich liegen haben so wie die Nash-Tabelle. Das ist auch ein starkes Argument dafür, dass die Gto Strategie selbst wenn sie möglich wäre zu ermitteln nie an die Öffentlichkeit gelänge, da der Entdecker nie so dumm wäre und lieber die Gto-Strategie im stillen für sich nutzen würde.

      Eine weitere schwierigkeit für das ermitteln einer Gto Strategie sind multiwaypots bei denen mit jedem zusätzlichen Spieler die Möglichkeiten des spielverlaufs exponentiell Anwachsen. In multiwaypots könnte man sagen, dass man vielleicht besonders ehrlich spielen sollte. Aber es ist gar nicht so einfach.
      Mal angenommen ich würde in einem 5 Way multipot nur 2pair+ aggressiv spielen dann würden wir wahrscheinlich ganz selten ausgezahlt werden, weil wir keine wirklichen Bluffs haben. Womöglich muss man in multiwaypots auch ab und zu mal bluffen.

      Dann steht noch die Frage im Raum ob es sich lohnt eine so ausgefeilte Strategie überhaupt erlernen zu wollen, weil es niemanden gibt der so arg darauf schaut ob man selber gebalanced ist und dieser das dann Hyperexploitet.
    • Ickki
      Ickki
      Bronze
      Dabei seit: 08.11.2010 Beiträge: 962
      Original von Happa2
      Wäre es möglich Gto so zu berechnen dass man BB und SB als Ante sieht und man den Gegnern zb statt 10000 verschiedenen Ranges einfach mal 100 verschiedene Ranges gibt Angefangen mit paar extremen Ranges wie AA only und dann noch eine 100 Prozent Range und dann noch 98 etwas realistischere Dinger.
      Nein, weil du dadurch das ganze Spiel abstrahierst und nur eine Approximation bekaemest, vorausgesetzt der Rest der Methodik stimmt.

      Man kann auch SB und BB nicht als Ante sehen, weil die Moeglichkeit zu callen auch die pre-flop raising Frequenzen beeinflusst. Du kannst nicht den einen Baum vom anderen isolieren und danach wieder hinzufuegen, um ein Ergebnis fuer call und raise pre-flop zu bekommen.

      Original von Happa2
      Wenn man BB und Sb als Ante sehen würde wäre ja schon einmal klar woher unser Gewinn von den vielen Folds von dem AA-only Spieler käme. Wenn man den BB und Sb normal hat dann bringt uns ein Fold vom Button zb keinen unmittelbaren Profit. Von diesem Button werden wir erst einen Gewinn bekommen wenn er zu häufig seinen BB oder Sb foldet. Es ist klar, dass der Button Verlust macht wenn er zu Tight ist aber es wäre wichtig zu wissen für die postflop Analyse wie hoch dieser Verlust durch zu viele folds wäre vielleicht mit Hilfe von Datenbanken oder Erfahrungswerten?? Vllt ist das mit der Ante auch nicht so schlecht.....
      Ab dem Moment, wo du Erfahrungswerte mit reinnimmst, ist es keine GTO Berechnung mehr, im strikten Sinne.

      Original von Happa2
      Die postflop Analyse würde dann so Vorgehen, dass man seine Strategie offenlegt diese kann aber Gewichtungen enthalten etc sie kann also flexibel sein und die gegnerische Range wird immer max ev gegen uns spielen uns also maximal exploiten.

      Die Strategie des Gegners wäre uns nicht bekannt aber wir kennen seine Möglichkeiten aufgrund der Möglichkeit dass er Betten Raisen Callen oder folden kann.

      Die Sache ist noch dass wir unsere Range gegen alle Gegner identisch spielen würden (aber mit Gewichtungen) wir. Würden sozusagen gegen jede Range des Gegners die gleichen Hände b/f oder b/c.
      Es gibt keine absolute GTO Strategie. Es gibt nur Strategiepaare, die gegeneinander nur den Wert des Spiels erreichen. Daher kannst du GTO so nicht berechnen, da du gegen verschiedene Frequenzen des Gegners deine eigenen Frequenzen/Range veraendern musst.

      Wenn du deinen Ansatz so durchziehen wolltest, muesstest du fuer deine Range gegen alle Moeglichkeiten des Gegners alle Teile deiner Range mit allen moeglichen Frequenzen durchsimulieren. Und da sind wir dann schonwieder bei NP-vollstaendiger Komplexitaet; also unloesbar.

      Original von Happa2
      Das führt uns zu der Schlussfolgerung, wenn der Gegner unsere Strategie vollkommen kennt also von Flop bis River (oder sogar Preflop) er einfach durch einen variantenbaum weiß was das beste für ihn ist.

      Die Verzweigungen des Baumes würden alle Möglichen Plays des Gegners berücksichtigen und unsere fixierte statische Strategie. Da wir immer gleich reagieren sind wir kein handelnder Spieler mehr in dem Sinne. Der gegnerische Spieler wird jetzt also uns, da er weiß wie wir spielen maximal exploiten und an den unteren Wurzeln des Baumes das Endergebnis wählen das am besten für ihn ist. Das Ergebnis kann zb in BB angegeben sein.
      Klar ist es schwierig eine optimale Strategie gegen eine statische Strategie zu finden aber ich denke eine Annäherung an das Optimum ist sehr wahrscheinlich.
      Du meinst eine maximal exploitative Strategie zu finden. Ansonsten funktioniert dein Ansatz nicht, einfach den max-EV Pfad im Baum zu waehlen. Du spielt ja gegen eine statische Strategie und nicht gegen alle moeglichen Strategien von Villain. Daher kann Villain keine optimale Strategie sondern nur eine max-EV Strategie finden.

      Eine maxEV Strategie gegen eine komplett statische Strategie zu finden ist nicht so schwierig. Ich habe sowas schon mit maschinellem Lernen gemacht. Mit dem Algorithmus von Yoav und Freund [1] findest du die maxEV Strategie gegen Villains Strategie, waehrend du gegen ihn spielst. Du musst also nicht einmal Villains Strategie auf Papier haben, das findet der Algorithmus selber raus.

      Original von Happa2
      Dieses Vorgehen würde man dann auf allen möglichen Boards anwenden mit jeder möglichen Range die der Gegner am Flop halten könnte. Die Bedingung von Gto ist, dass man dagegen nicht gewinnen kann. Dh wenn unsere fixierte Strategie gegen alle möglichen Ranges die optimal gegen uns spielen auf allen möglichen Boards dem Gegner keinen Profit gibt nur durch Shortterm-Luck dadurch dass wir ein schlechtes Board Hitten zb dann spielen wir Gto.
      Du meinst, wenn eine maxEV Strategie keinen Gewinn erzielen kann, ist sie GTO.

      Das ist so auch nicht ganz korrekt, denn GTO ist, wenn keiner der beiden Spieler von seiner Strategie abweichen kann, um einen hoeheren Gewinn zu erzielen. Das bedeutet nicht, dass der Erwartungswert, wenn beide Spieler GTO spielen null ist. Meist hat der Spieler IP einen positiven Erwartungswert bei GTO und der OOP Spieler einen negativen.

      Original von Happa2
      Jetzt stellt sich natürlich auch die Frage wie man zu dieser fixierten Strategie kommen könnte. Unsere Strategie ist auf jeden Fall an bestimmte Bedingungen geknüpft zb dürfen wir gegen eine bestimmte betsize nur eine bestimmte Prozentzahl an Händen folden, weil der Gegner bei zu vielen Folds autoprofit machen würde. Das heißt in vielen Spots können wir zb unsere maximale Check Folding Range ermitteln indem wir einfach die potgröße anschauen. Das gilt natürlich nur wenn wir Gto bis dahin gespielt haben.

      Das gute ist, dass wir in einem Spot auch die Gto-Spielweise ermitteln können und nicht mit unserer gesamten Strategie vergleichen müssen. Da jede cashgame-Hand unabhängig voneinander abläuft können wir einen Verlust in einem Spot mit einer Hand nicht so argumentieren, dass wir ja in einem anderen Spot so viel Gewinn machen würden. So können wir nur argumentieren im BB wo uns der Verlust aufgezwungen wird dieser gleicht sich aber aus durch die Gewinne in den anderen Positionen. Wir könnten auch einen Verlust rechtfertigen durch eine ungünstige Boardkonstellation dann müssten wir aber beweisen, dass das Gesamtergebnis wenn man alle möglichen Boardkonstellationen berücksichtigt nicht ins Negative geht.
      GTO kannst du nur fuer Situationen berechnen, wo die Hand auch beendet wird und eine Auszahlung stattfindet. Wenn du sagst, "angenommen wir haben bis dahin GTO gespielt" bedeutet das, dass du schon den gesamten Spielbaum geloest haben musst, da du vorherige Streets nur loesen kannst, indem du spaetere streets auch geloest hast.

      Original von Happa2
      Der Rake ist auch noch eine Schwierigkeit. Wenn jeder Gto spielt macht jeder Verlust.
      Das heißt wenn jemand Zugang zur Gto Strategie hätte und ein anderer das wüsste dann könnte er einfach seine Strategie kopieren. Noch schlimmer noch: er könnte sie verbreiten und dann würde auf einmal jeder die Gto Strategie neben sich liegen haben so wie die Nash-Tabelle. Das ist auch ein starkes Argument dafür, dass die Gto Strategie selbst wenn sie möglich wäre zu ermitteln nie an die Öffentlichkeit gelänge, da der Entdecker nie so dumm wäre und lieber die Gto-Strategie im stillen für sich nutzen würde.
      Wie kannst du eine GTO Strategie von einem anderen Spieler kopieren? Wenn das so moeglich waere, wuerde doch jeden Phil Iveys Strategie kopieren, weil sie nahe maxeV erzeugt.

      Original von Happa2
      Eine weitere schwierigkeit für das ermitteln einer Gto Strategie sind multiwaypots bei denen mit jedem zusätzlichen Spieler die Möglichkeiten des spielverlaufs exponentiell Anwachsen. In multiwaypots könnte man sagen, dass man vielleicht besonders ehrlich spielen sollte. Aber es ist gar nicht so einfach.
      Mal angenommen ich würde in einem 5 Way multipot nur 2pair+ aggressiv spielen dann würden wir wahrscheinlich ganz selten ausgezahlt werden, weil wir keine wirklichen Bluffs haben. Womöglich muss man in multiwaypots auch ab und zu mal bluffen.
      Korrekt. Um GTO zu spielen, muessen immer Bluffs in der Strategie enthalten sein. Dies ist in Binmores Buch "Fun and Games" [2] sehr schoen beschrieben.


      Original von Happa2
      Dann steht noch die Frage im Raum ob es sich lohnt eine so ausgefeilte Strategie überhaupt erlernen zu wollen, weil es niemanden gibt der so arg darauf schaut ob man selber gebalanced ist und dieser das dann Hyperexploitet.
      Wie willst du eine komplett balancierte, also GTO strategie hyperexploiten? Das widerspricht doch der Definition von GTO.

      Bedarf ist allemal da. Was meinst du, wieviele Botentwickler dafuer Millionen ausgeben wuerden. Ausserdem hat man dann eine Referenzstrategie und kann umso besser adaptieren, wenn der Gegner von der GTO Strategie abweicht.

      Referenzen:

      [1] Freund, Y., & Schapire, R. E. (1999). Adaptive game playing using multiplicative weights. Games and Economic Behavior, 29(1), 79-103.

      [2] Binmore, K. (1992). Fun and games, a text on game theory.
    • 1
    • 2