Gedankenspiel, Abweichung Nash

    • Santalino2
      Santalino2
      Black
      Dabei seit: 08.06.2007 Beiträge: 2.888
      Angenommen 4 Spieler (alles Regs die häufiger aufeinander treffen) befinden sich im Buble-Play im "Push-or-Fold"-Modus. 3 Spieler pushen/folden 100% nach (Vakuum)Nash (d. h. sie kennen Gegner-Ranges nicht und adapten auch nicht) und ein Spieler (nennen wir ihn mal Santos) pusht nach Nash aber foldet auf Gegnerpush einfach 10% weniger (als Vakuum-Nash). Wer gewinnt/verliert auf Dauer (die nächsten 10k+ Spiele) am meisten? Ich denke die Antwort ist für alle klar (die 3 Nash-Spieler werden genau gleich viel und am meisten gewinnen und Santos verlieren).

      Jetzt das gleiche noch mal, nur mit der Änderung das einer von den 3 Nash-Player (nennen wir ihn mal MrClever) anfängt auf Santos zu adapten und gegen ihn weniger pusht (und zwar genau so, dass er durch Santos looses Calls, kein Geld an die anderen 2 Nash-Player verteilt). Wer gewinnt jetzt am meisten? Ich denke die Antwort ist auch klar, MrClever gewinnt das meiste, danach kommen die 2 verbleibenden (Vakuum)Nash-Pusher und Santos verliert.

      Letzte Änderung, das gleiche Spiel nur dieses mal adapten alle 3 der ursprünglichen (Vakuum)Nash-Player auf Santos und pushen gegen ihn weniger. Wer gewinnt/verliert jetzt am meisten?

      Hier bin ich unsicher, Santos verliert zwar bei jedem leicht falschen Call etwas ev, aber gleichzeitig pushen ja jetzt 3 Spieler weniger in ihn (und das addiert sich in der Summe evtl. stärker als die einzelnen Minus-EV-Calls kosten...). Und wenn man jetzt davon ausgeht, dass jeder der 3 Spieler in erster Linie Egoist ist und seine pushing-Range genau so anpasst, dass er durch Santos looses Calls möglichst nix/wenig an andere verteilt, dann könnte ja insgesamt gesehen sogar Santos den höchsten Gesamt-EV haben, oder? Was denkt ihr?
  • 29 Antworten
    • DasWodka
      DasWodka
      Bronze
      Dabei seit: 25.11.2009 Beiträge: 5.684
      Ich denke, dass der hinzugewonnen EV durch die gestiegene FE nicht die -EV calls wett machen wird. Grade wenn adeptet wurde, sind diese ja noch stärker -EV.
      Mir kommt es einfach schon falsch vor, dass wenn jmd von nash abweicht, auf ihn adaptet wird, er dann profitabel sein kann.

      Bin mir nicht sicher, ob der folgende spoiler Sinn macht. Denke morgen nochmal nach:
      Man muss ja auch bedenken, dass die höhere FE auch in den einzelnden Situationen den anderen hilft. Also wenn Santos SB ist, BU deshalb weniger shipt, profitiert in dem Moment der BB von Santos looseren callingrange. Das gleicht sich unter den dreien dann longtern aus. Da ist es auch egal, ob die Spieler egoistisch sind, denn für den BU ist die angepasste Range die profitabelste.

      Gruss DasWodka
    • Santalino2
      Santalino2
      Black
      Dabei seit: 08.06.2007 Beiträge: 2.888
      zu deinem Spoiler, ok, was passiert jetzt aber wenn Santos nur als BB die SB Pushs looser callt und ansonsten normal spielt?
    • madein1984
      madein1984
      Bronze
      Dabei seit: 06.02.2007 Beiträge: 4.223
      dann wird, sofern die Gegner wirklich sehr schlau sind, nur der SB tighter pushen und nicht CO und BU, wenn du im BB bist.

      Dennoch ist dein genanntes Beispiel der Grund, weshalb ich in spots, in denen ich mir nicht ganz sicher bin, öfter calle als folde. Wenn man als nit wahrgenommen wird, ist es in Wirklichkeit ein kleines Desaster, wenn die Gegner anfangen, looser in einen hinein zu pushen.

      Zu deinem op:
      Ich glaube, die Gesamtsituation ist zu komplex, um das hier ohne weiteres beantworten zu können. Man müsste eine Simulation erstellen, und sich die Results nach einer großen Anzahl Games ansehen. Falls eine solche Adaption möglich ist, wäre es aber eigentlich kein Nash-Gleichgewicht mehr. Und diese sind ja erst durch Simulation entstanden, oder?
      Ich fand den Gedanken im ersten Moment richtig, wenn ich mir die Natur von Nash allerdings ansehe und mich frage, wie diese Gleichgewichte entstanden sind, halte ich es für weniger wahrscheinlich, dass so etwas möglich ist.

      Eine ganz andere Frage ist, ob die Spieler in der Lage sind, ihre Range richtig anzupassen gegen die Abweichungen. Das halte ich für sehr schwierig, da man ja auch wissen müsste, mit welchen Händen du abweichst. Ich denke, dass bei einer kleinen Abweichung von santos sich die ranges der anderen perfekt spielenden Gegner fast gar nicht verändern.
    • DasWodka
      DasWodka
      Bronze
      Dabei seit: 25.11.2009 Beiträge: 5.684
      Mal ein anderer Weg bzw Denkanstoß. Durch die veränderte bvb Dynamik müsste sich ja auch der ev für co und bu verändern, da die blinds ja jetzt öfters oder seltener colluden.

      Darauf bin ich gekommen als ich mich gefragt habe, wo der ev herkommen soll. Denn iwo her muss er ja kommen. Ich kann mir nicht vorstellen, dass es von dem sb kommen kann. Ist halt schwierig zu beweisen, da ich auch kein Mathematiker bin und es ja um sehr marginale unterschiede geht.

      Von co und bu könnte es aber schon kommen, da es ja durch den bubble Faktor eher so ist, dass 10% Erhöhung der callingrange meist zu einer Verkleinerung der pushingrange > 10% ist und somit die colluding warscheinlichkit sinkt, oder?
    • GrandmasterFleisch
      GrandmasterFleisch
      Bronze
      Dabei seit: 08.03.2006 Beiträge: 568
      Original von madein1984
      [...]Das halte ich für sehr schwierig, da man ja auch wissen müsste, mit welchen Händen du abweichst. Ich denke, dass bei einer kleinen Abweichung von santos sich die ranges der anderen perfekt spielenden Gegner fast gar nicht verändern.
      Man darf eben nicht mit KTo den -EV call machen und mit KJo den +EV call.
      Ich bin der Meinung das eine lineare erweiterung des Handbereichs die falsche lösung ist.

      Das Problem ist doch folgends: SnGs sind stark zukunftsorientiert - ein NASH gleichgewicht ist das nicht. Eine FGS ist zukunftsorientiert (und tut nebenbei einen anstieg der Blinds nicht berücksichtigen) und stößt wie NASH schnell an seine Grenzen.

      Um das konzept von OP korrekt zur Anwendung zu bringen nimmt man einfach ein paar Hände dazu die einen sehr weiten Handbereich andeuten, der in Wirklichkeit natürlich kaum von einer optimalen Range abweicht.
      Man nimmt eben T :diamond: 9 :diamond: und J :club: T :heart: usw dazu. Eben ein paar Hände die weiter vom Optimum entfernt sind wie die oben genannte KTo Hand.

      Die kollisionswahrscheinlichkeit bleibt dadurch langfristig sogar gleich - Man nimmt die KJo Hände raus (die nun unprofitabel werden - die Gegner passen sich an und pushen nun weniger). Das würde natürlich nur für einen Call aus Heros sicht stimmen - er würde öfter first in kommen (zB im SB) und somit auch öfter einen call bekommen wie andere Spieler. Aber das ist ja eigentlich das was man will...

      Ob das profitabel ist - oder profitabler wäre - müsste natürlich eine Simulation beweisen...

      Wie gesagt: Das Problem der Gegner ist das sie dir eine Lücke im Handbereich nicht nachweisen können. Wieviele Reg-Bubbels müssten sie gegen dich spielen um dir zu das zu beweisen (selbst wenn du T :diamond: 9 :diamond: niemals durch T :club: 9 :club: ersetzen würdest).

      Das wichtigste ist einfach das man erkennt das die seit Jahren vorherschenden Konzepte und Modelle ein Versuch sind sich einer Realität an zu nähren die keiner kennt.
    • Santalino2
      Santalino2
      Black
      Dabei seit: 08.06.2007 Beiträge: 2.888
      Edit: Noch mal selbst drüber nachgedacht und hat sich erledigt (manchmal hilft denken wirklich, lol)
    • Annuit20
      Annuit20
      Bronze
      Dabei seit: 14.09.2007 Beiträge: 9.230
      FALSCH

      NASH = Gleichgewicht --> edge für alle = 0
      Anpassung der Pushingrange an zu loose Callingrange alle Entscheidungen sind +Ev, auch die Folds (man verliert logischerweise ein wenig nach ICM in den einzelnen spots).
      Zu loose Callingrange einige Entscheidungen sind -EV.

      Abweichung NASH= Kein Gleichgewicht --> Spieler 1,2,3 edge größer > 0 --> Spieler loose Edge < 0

      In SnGs gewinnt man durch die Kollision der Mitspieler $EV kein cEV. Somit Profitieren sofort alle anderen (noch mehr) am Tisch wenn jemand -Ev callt oder pusht.
      €: Deshalb sollte man auch seine Pushingrange der zu loosen Callingrange anpassen, weil die Unbeteiligten sonst $-Zeichen in die Augen bekommen ;)

      Ergo im Schnitt verbrennt der loose Spieler ohne Ende Geld an die GTO Spieler.

      Danke das du uns an deinem Ergebnis hast teil haben lassen :P
    • Annuit20
      Annuit20
      Bronze
      Dabei seit: 14.09.2007 Beiträge: 9.230
      Also ich habe heute selbst noch mal ein wenig mit dem HRC paar Spots durch gesehen und was ich geschrieben habe ist falsch.

      Sollten die Pusher Adapten gewinnt der loose Spieler im Schnitt EQ und das sogar ziemlich viel. Sollten sie nicht adapten verliert der caller jeweils ein wenig EQ der Pusher ziemlich viel.

      Wenn man die 3 NASH spieler als Team betrachten würde wäre es longtherm besser wenn sie nicht von der NASH range abweichen. Da dies aber nicht der Fall ist (sein darf) sollte man seine pushingrange anpassen und muss dem zu loosen caller gratulieren das er uns in eine sehr schlechte lage bringt, nähmlich die das wir longtherm in diesen spots mehr EQ verlieren.

      €: Die Erkenntnis kam mir wieder heute beim betrachten der Plots vom HRC.

      Weil ich gerade dabei bin ein Beispiel:
      Drauf klicken falls zu klein.


      Pusher (NASH Range)


      Caller (loose Range)



      Plot (Beide Ranges nach NASH)


      Man kann sehen das wenn BB hier ~29% callt bei einer ~57% Pushingrange beträgt seine EQ ~ -0.07. Die des SB beträgt ~ -0.45!

      Sollte SB adapten hat SB gegen eine 29% Callingrange nur noch eine ~ 17,5% +EV Pushingrange.
      Ergebnis ist das BBs range longtherm ~ 0.5 EQ erreicht und die des SB ~ -0.10!!!

      :s_o: :f_confused: :s_mad:

      Vertauscht man die Stacksizes sieht das ganze so aus
    • Santalino2
      Santalino2
      Black
      Dabei seit: 08.06.2007 Beiträge: 2.888
      @Annuit
      Glaube du hast dich bei deinem letzten Post irgendwie selbst gelevelt (evtl. durch die Plot-Diagramme die ich halt gar nicht verstehe und mich dadurch dann zumindest der selbst-level-Gefahr entziehen konnte^^...weil unmöglich, sonst wäre Nash einfach falsch...). Dein vorletzter Post ist richtig und beschreibt es gut (bis auf die spätere Falsch-Kennzeichnung^^). Edit: Evtl. war ein Fehler, dass du nur auf die Handrange geschaut hast und gesehen dass es für den Pusher dann weniger Hände gibt die er +ev pushen kann...das ist korrekt, allerdings ist dadurch der gesamtEV halt trotzdem nicht niedriger, sondern sogar höher, weil er mit den +evPush-Händen je Hand mehr verdient (da diese ja gegen loosere Calling-Range einen höheren EQ haben und das damit dann mehr als ausgeglichen wird)

      Zusammenfassend: Nash-Wert ist optimaler Punkt, jede Abweichung führt bei korrekter Adaption der anderen zu schlechterem Ergebnis für den Abweichenden. Obs jetzt eins, zwei oder drei MrClever gibt ändert daran nicht, nur das Santos dann von 3 Leuten maximal expolitet wird und dadurch am meisten verliert. Mitnehmen kann man sich allerdings, dass es im Zweifelsfalle wohl kein großer Fehler ist etwas loser zu callen (da man im Vergleich zum Pusher weniger verliert und ihn zusätzlich evtl. schocken und gewisse Über-Adaption inducen kann...und bis er genug Stats hat um richtig zu adapten dauerts schon etwas...und Future-Game-Simluations deuten auch darauf hin, dass in bestimmten Situationen nicht nur leichte -evPushs, sondern analog auch leicht -evCalls gut sein können...nur so wie im Eingangspost dargestellt, macht eine generell loosere Callingsrange halt keinen Sinn...).

      @ps.com-Coachs
      Habt ihr alle geschlafen? Ich meine ich habe x Jahre sng-Pause gemacht und jetzt nur mal aus Langeweile (und wenn ich gerade keine andere Action hatte und kein sc2-Stream gelaufen ist^^), wieder angefangen (Nostalgie) paar sngs zu spielen und kam dann halt auf diese Schnappsidee...aber für euch muß das doch sofort klar gewesen sein, dass das Käse ist...das nächste mal bitte SOFORT melden und uns aufklären...habe jetzt x Stunden Lebenszeit verschwendet um über so eine schwachsinnige Idee (die nicht mal funktioniert) nachzudenken^^.
    • Annuit20
      Annuit20
      Bronze
      Dabei seit: 14.09.2007 Beiträge: 9.230
      Ich frag mal plexiq, aber wenn ich mich nicht täusche müsste es ansatzweise stimmen.
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.043
      Hab jetzt nur die letzten Posts und OP im Detail gelesen, aber das Beispiel von Annuit stimmt schon so.

      Der Fehler von Santalino is hier:
      Zusammenfassend: Nash-Wert ist optimaler Punkt, jede Abweichung führt bei korrekter Adaption der anderen zu schlechterem Ergebnis für den Abweichenden.
      Die Bedingung für ein Nash Equilibrium ist lediglich dass kein Spieler durch eine unilaterale Änderung seiner Strategie seinen EV verbessern kann. Dh alle Strategien bleiben fixiert und nur ein einziger Spieler weicht aus dem Equilibrium ab, der abweichende Spieler darf seinen EV nicht verbessern können.

      Das ist im Beispiel von Annuit auch nicht der Fall: Wenn alle anderen bei den Nash Ranges bleiben und nur er looser callt, verliert er EV. Dh wir haben keine Verletzung der Nash Bedingung.

      Nash macht keinerlei Aussage darüber was passiert wenn andere Spieler anfangen auf diese Änderung zu adapten.

      Falls der Pusher in dem Beispiel adaptiert und tighter wird, steigt Annuit hier besser aus als im Equilibrium. Der adaptierende Pusher steigt schlechter aus als im Equilibrium, aber wesentlich besser als weiterhin mit der Nash Range in die loose Calling-Range zu pushen.
    • Annuit20
      Annuit20
      Bronze
      Dabei seit: 14.09.2007 Beiträge: 9.230
      Super, vielen dank. ich schaue gerade schon das Video von deinem Coaching mit Unam. Aber dann hab ich den Plot doch richtig gelesen.

      btw "unilaterale" musste ich im Duden nachschlagen :f_biggrin:
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.043
      Yup, ich glaub das Beispiel im Coaching war sogar sehr ähnlich.

      [Unilateral: Heh, hatte nur die englische Definition im Kopf und war faul beim Übersetzen ;) ]
    • Annuit20
      Annuit20
      Bronze
      Dabei seit: 14.09.2007 Beiträge: 9.230
      Ja war sehr Ähnlich. Ich bin dann jetzt mal an den Tischen den Regs ihren ROI versauen :coolface:
    • Santalino2
      Santalino2
      Black
      Dabei seit: 08.06.2007 Beiträge: 2.888
      @plexiq
      hmmm, ich denke halt, das Equilibrium wird durch Iteration und Annäherung an optimalen Wert ermittelt. Wenn durch Abweichung jetzt auf einen früheren Iterationsschritt gewechselt wird (z. B. den 50.) dann ist dieser im Vergleich zum 100. halt weiter vom Optimum entfernt und daher muß der GesamtEV für den auf den Abweicher adaptierenden Pusher dadurch höher sein.

      @Annuit
      Poste mal bitte zu deinem Bsp. den Blind-Level und die genauen Chip-Stände. Will das dann damit mal selbst nachrechnen, weil verstehe zwar jetzt langsam was diese Plots darstellen wollen, aber traue denen nicht (traue keinen Plots die du nicht selbst gefälscht hast, lol).
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.043
      ^ Die Berechnung konvergiert im besten Fall in einem Nash Equilibrium, und im Normalfall sollten spätere Iterationen näher an einem NE dran sein als frühere. So weit so gut.

      Wir haben aber auch bei einem perfekten NE keinerlei Aussage darüber was passiert wenn mehr als 1 Spieler aus dem Equilibrium abweicht. Das wäre hier ja der Fall: Spieler #1 callt looser als NE, und Spieler #2 adaptiert auf die Abweichung von Spieler #1.

      Da nun 2 Spieler abweichen kann das auch in einem perfekten NE für den ursprünglich abweichenden Spieler profitabel sein.

      -

      Der springende Punkt ist hier der folgende:
      Der loosere Caller muss hier dem Pusher erfolgreich suggerieren dass er längerfristig bereit ist -EV Calls in diesen Spots zu machen. Denn die ursprüngliche Abweichung ist ja erst mal -EV, nur wenn der Pusher in Zukunft seine Range adaptiert wird es profitabel.

      Das interessante an dem Spot ist, dass Spieler #1 + Spieler #2 in Summe besser aussteigen als im NE.

      Als Beispiel: Du "spite callst" einen Reg so lange bis er gegen dich tighter pusht. Er revanchiert sich im Gegenzug und fängt an dich zu spite callen, weshalb du in der umgekehrten Situation ebenfalls tighter pushst. Ihr profitiert im Endergebnis beide, auf Kosten der anderen Spieler. Allerdings geht das schon gefährlich nahe in Richtung Kollusion.

      Ist durchaus etwas unintuitiv, du initiierst hier eine implizite Kollusion indem du Calls machst die erst mal beiden Betroffenen schaden.
    • Annuit20
      Annuit20
      Bronze
      Dabei seit: 14.09.2007 Beiträge: 9.230
      Original von Santalino2
      ...
      @Annuit
      Poste mal bitte zu deinem Bsp. den Blind-Level und die genauen Chip-Stände. Will das dann damit mal selbst nachrechnen, weil verstehe zwar jetzt langsam was diese Plots darstellen wollen, aber traue denen nicht (traue keinen Plots die du nicht selbst gefälscht hast, lol).
      raw History Text:
      PokerStars Hand #107788295413: Tournament #825549598, $6.70+$0.30 USD Hold'em No Limit - Level IV (30/60) - 2013/11/30 3:06:41 CET [2013/11/29 21:06:41 ET]
      Table '825549598 1' 9-max Seat #6 is the button
      Seat 2: artetan (403 in chips)
      Seat 6: mantre1972 (2485 in chips)
      Seat 7: LiffEX (654 in chips)
      Seat 8: Annuit20 (958 in chips)
      artetan: posts the ante 6
      mantre1972: posts the ante 6
      LiffEX: posts the ante 6
      Annuit20: posts the ante 6
      LiffEX: posts small blind 30
      Annuit20: posts big blind 60
      *** HOLE CARDS ***
      Dealt to Annuit20 [3c 7c]
      artetan: folds
      mantre1972: folds
      LiffEX: raises 588 to 648 and is all-in
      Annuit20: folds
      Uncalled bet (588) returned to LiffEX
      LiffEX collected 144 from pot
      LiffEX: doesn't show hand
      *** SUMMARY ***
      Total pot 144 | Rake 0
      Seat 2: artetan folded before Flop (didn't bet)
      Seat 6: mantre1972 (button) folded before Flop (didn't bet)
      Seat 7: LiffEX (small blind) collected (144)
      Seat 8: Annuit20 (big blind) folded before Flop
    • plexiq
      plexiq
      Diamant
      Dabei seit: 28.12.2006 Beiträge: 1.043
      Als Gedankenstütze ein kleines Toy Game zu dem Thema:
      code:
      Caller/Pusher	push_nash	push_tight
      call_nash 	 0, 0		60,-5
      call_wide	-5,-50		50,-10


      Die Strategien push_nash / call_nash sind ein NE für dieses Spiel, keiner der Spieler kann profitabel abweichen.

      Falls der Caller "call_wide" spielt ist das für beide unprofitabler, adaptiert der Pusher zu "push_tight" um seine Verluste zu minimieren, profitiert der Caller davon. Wie auch im ursprünglichen Beispiel ist der neue call_wide / push_tight Zustand *kein* Nash Equilibrium. Der Caller könnte hier ja profitabel zu call_nash wechseln.
    • Santalino2
      Santalino2
      Black
      Dabei seit: 08.06.2007 Beiträge: 2.888
      Ok, habe jetzt an Annuits Bsp. bißchen rumgerechnet und kam auf folgendes Ergebnis:

      Bigblind $ev
      a) sb und bb pushen/callen Nash => 15,71
      b) sb pusht Nash, bb callt looser => 15,69
      c) sb pusht tighter, bb callt looser => 15,97

      Prozentual auf EQ umgerechnet komme ich damit allerdings auf andere Werte (zwischen -0,73% bis 1.09%) als die im Plot angegebenen. Das interessante war allerdings die grundsätzliche Frage, kann sb durch looseres callen und pusher-Adaption trotzdem mehr gewinnen und ja, das scheint wohl tatsächlich der Fall zu sein und Annuit und plexi hatten Recht.

      Wobei ich vor Thread-Eröffnung auch irgendwie beim Spielen das Gefühl hatte, looser callen könnte ganz gut sein (wobei das evtl. auch nur dadurch kam weil ich durch maingame (cg) sowieso laufend in Chips gedacht und wohl recht vieeel gecallt habe^^), aber der logische Teil meines Hirns hat mir dann immer eingeredet , HALTE DICH ZURÜCK, Nash-Abweichen kann nicht gut sein und dann war ich schließlich irgendwann genug verwirrt um diesen Thread zu eröffnen, lol.

      Hier meine Berechnung (wer gerade Langeweile hat, darf gerne auf Fehlersuche gehen...und/oder das verbleibende Rätsel lösen warum Plot andere Werte anzeigt)

      1. Variante mit Kommentar





      Rechenweg anderer 2 Varianten analog (Copy/Paste und nur Push/Call-Range, EQ-bb-vs-SB und Beschriftung angepasst)




    • 1
    • 2