Reizgeneralisationstraining - Entstehung von Leaks

    • Krach-Bumm-Ente
      Krach-Bumm-Ente
      Black
      Dabei seit: 01.05.2006 Beiträge: 10.400
      Hi,

      ich weiß nicht ob der Post jemandem praktisch was bringen kann, ich versuch nur die Theorie die ich gerade lern etwas praktisch anzuwenden. Beim folgenden Thema hab ich direkt an Poker gedacht: Reizgeneralisationstraining.

      Wenn ein bestimmter Reiz (z.B. Licht mit 550nm Wellenlänge) eine bestimmte Reaktion auslöst (Taube pickt gegen einen Knopf und bekommt dafür Futter) dann hat die Taube eine Assoziation zwischen dem Stimulus S (Licht), ihrer Reaktion R (picken) und dem outcome O (Futter) hergestellt. Kurz: S(R-O)-Assoziation.
      Wenn jetzt der Reiz Licht mit 550nm Wellenlänge durch Licht mit 560nm Wellenlänge ausgetauscht wird reagiert die Taube je nach Erfahrung unterschiedlich. Hat sie kein Training bezüglich unterschiedlicher Wellenlängen bekommen wird sie auf den nur geringfügig anderen Reiz von 560nm nahezu gleich oft reagieren wie auf den 550nm Reiz.
      Das Ausmaß der Reaktion nimmt linear mit dem Unterschied des neuen Reizes (x nm) vom ursprünglichen Reiz (550nm) ab. Licht mit 800nm Wellenlänge löst wenig bis gar keine Reaktion mehr aus.
      Die Fähigkeit kleine Unterschiede zwischen Reizen zu erkennen kann trainiert werden (und macht einen "Experten" aus).

      Was hat das mit Poker zu tun?
      Wenn ein Spot A als Reiz (bestimmte Holecards + Boardkonstellation + Gegnerverhalten) eine bestimmte Reaktion (z.B. all-in) auslöst und das outcome verstärkend wirkt (Geld gewonnen) wird die S(R-O)-Assoziation gestärkt. Hero wird in diesem Spot in zukunft wieder all-in gehen da das outcome die Reaktion von Hero verstärkt hat.
      Wenn jetzt ein Spot B auftritt der Spot A ähnlich zu sein scheint und Hero den Unterschied zwischen Spot A und B nicht feststellen kann (Spot A - 550nm, Spot B - 560nm) dann folgt auf Reiz Spot B die selbe Reaktion wie auf Reiz Spot A.
      Wir wissen aber, dass kleine Unterschiede im Poker große Auswirkungen auf das eigene Play haben können - z.B. wird der selbe Spot gegen stations oft anders gespielt als gegen LAGs, ein +EV-play wird dadurch schnell zu einem -EV-play.
      Stellen wir den Unterschied aber nicht fest und moven wieder all-in, obwohl es theoretisch -EV ist, und gewinnen wieder, dann wird die Assoziation weiter verstärkt. Wir stellen nächstes mal sowohl in Spot A als auch in B rein und werden öfter verlieren als wir gewinnen. Da wir aber das all-in mit Gewinnen assoziieren bemerken wir den Fehler nicht und tun es als Pech ab. Wir haben uns ein Leak angeeignet.
      Durch diesen Vorgang wird Spot A mit Spot B in einen Topf geworfen, Psychologen nennen das Reizgeneralisationstraining.

      Der Reizgeneralisationsgradient gibt an wie gut wir zwischen ähnlichen Reizen unterscheiden können. Je steiler, desto besser können wir Unterschiede feststellen, und desto erfolgreicher sind wir longterm beim Pokern.

      Das ist wohl nichts neues, aber vllt. hilft das Wissen um die Mechanismen dahinter und der Beweis im Labor dem ein oder anderen sich Leaks eher einzugestehen.
  • 12 Antworten
    • mergelina
      mergelina
      Bronze
      Dabei seit: 28.03.2008 Beiträge: 2.653
      Danke für den guten Beitrag. Finde ihn für jeden hilfreich, besonders aber für die vielen unausgereiften Masstabler.
    • TeamHCC
      TeamHCC
      Global
      Dabei seit: 01.12.2009 Beiträge: 1.422
      Ach herrlich... das klassische Konditionieren.... Pawlow lässt grüßen.
    • Krach-Bumm-Ente
      Krach-Bumm-Ente
      Black
      Dabei seit: 01.05.2006 Beiträge: 10.400
      Original von TeamHCC
      Ach herrlich... das klassische Konditionieren.... Pawlow lässt grüßen.
      Das ist instrumentelle Konditionierung ;)
    • TeamHCC
      TeamHCC
      Global
      Dabei seit: 01.12.2009 Beiträge: 1.422
      Also für mich klingt es eher nach der klassischen. Instrumental sagt mir gar nix. Aber es wurde ja auch nicht alles bei mir in Psychologie behandelt.

      Worin besteht denn der wesentliche Unterschied?
    • pg89
      pg89
      Bronze
      Dabei seit: 05.04.2008 Beiträge: 6.001
      Und wo ist jetzt das in der überschrift angesprochene "trainig"? :rolleyes:
      Finde den beitrag auch gut, aber so eine erklärung alleine hilft leider relativ wenig..
    • Krach-Bumm-Ente
      Krach-Bumm-Ente
      Black
      Dabei seit: 01.05.2006 Beiträge: 10.400
      Original von TeamHCC
      Also für mich klingt es eher nach der klassischen. Instrumental sagt mir gar nix. Aber es wurde ja auch nicht alles bei mir in Psychologie behandelt.

      Worin besteht denn der wesentliche Unterschied?
      KK erfordert keine response von der Versuchsperson, es konditioniert einfach eine Reaktion (Speichelfluss) auf einen Reiz (Ton). IK erfordert eine Reaktion der Versuchsperson um einen Verstärker zu erhalten.

      Original von pg89
      Und wo ist jetzt das in der überschrift angesprochene "trainig"? :rolleyes:
      Finde den beitrag auch gut, aber so eine erklärung alleine hilft leider relativ wenig..
      :rolleyes:
      Les nochmal genau. Das Training findet von alleine statt und ist das Problem von Hero. Warum willst du Reizgeneralisation trainieren? Genau das Gegenteil ist das Ziel.
    • TeamHCC
      TeamHCC
      Global
      Dabei seit: 01.12.2009 Beiträge: 1.422
      Original von Krach-Bumm-Ente
      IK erfordert eine Reaktion der Versuchsperson um einen Verstärker zu erhalten.
      Was Du als IK bezeichnest, kenne ich unter den Begriff "operantes Konditionieren"(OK):

      Auf eine Reaktion erfolgt ein Reiz. (Thorndikes Katzenexperiment)

      Also dein Taubenbeispiel ist für mich die klassische Konditionierung 1. Ordnung:

      Sie reagiert AUF das Licht. Damit steht der Reiz VOR der Reaktion und nicht umgekehrt, was aber genau der springende Punkt ist.
      ("Wenn ein bestimmter Reiz (z.B. Licht mit 550nm Wellenlänge) eine bestimmte Reaktion auslöst")

      Darüber hinaus kann man eine Reaktion auf eine bereits erlernte Reiz-Reaktionsverbindung aufbauen, was dann das KK 2. Ordnung ist.

      Außerdem ist die Reizgeneralisierung genauso ein wichtiger Bestandteil der KK wie das Gesetz der Kontiguität, der Reizdifferenzierung und der Extinktion.


      Ich lasse mich gern eines besseren belehren..... aber genau das war vor gut drei Wochen Thema meiner vierstündigen Prüfungsarbeit.
    • Krach-Bumm-Ente
      Krach-Bumm-Ente
      Black
      Dabei seit: 01.05.2006 Beiträge: 10.400
      Operantes Konditionieren ist das selbe wie instrumentelles Konditionieren.

      Und auch beim IK/OK steht der Reiz vor der Reaktion. In jedem Experiment was wir bei operanter Konditionierung betrachtet haben kommt ein Reiz. Oft sind sie halt nicht so offensichtlich wie ein Licht oder Ton. Wenn du im Auto sitzt ist deine Reaktion den Schlüssel reinzustecken und umzudrehen. Aber auch hier gibt es einen Reiz auf den du diese Reaktion zeigst (Kontextreiz in dem Fall). Das ist mit S(R-O) Assoziationen gemeint.
      Dass es vor jeder Reaktion einen Reiz gibt lässt sich auch relativ einfach nachweisen. Betrachte einfach mal Extinktion genauer (hint: die Situationen, in denen nach Extinktion wieder das ursprünglich antrainierte Verhalten gezeigt wird).
    • 0tijuana0
      0tijuana0
      Einsteiger
      Dabei seit: 17.11.2011 Beiträge: 55
      der geistreichste Post den ich hier jemals gelesen habe (bin aber auch noch nicht lange dabei) :heart:

      Folgende Frage tut sich mir aber auf:
      Ist der Reizgeneralisationsgradient genetisch bedingt oder gibt es Möglichkeiten seinen persönlichen Gradienten zu verbessern, um eben
      Reize weniger zu generalisieren?
    • Krach-Bumm-Ente
      Krach-Bumm-Ente
      Black
      Dabei seit: 01.05.2006 Beiträge: 10.400
      Der lässt sich durch Übung verbessern. Wär ja auch schlimm wenn nicht, dann könntest du ja nie lernen ähnliche Dinge/Situationen voneinander zu unterscheiden.
    • bensonv5
      bensonv5
      Bronze
      Dabei seit: 11.12.2011 Beiträge: 64
      Hey, toller Beitrag auch wenn ich mal unbeliebt mache und behaupte das viele das nicht so umsetzen können..

      Ich versuch es einfach mal in eigenen Wörtern auszudrücken, wie ich es persönlich verstehe und umsetze (also auch schon vor dem Beitrag ;) )

      Wir kommen oft in Situationen in der wir eine gewisse Handlung tun (eg. All in) und werden bestätigt oder eben nicht. In sehr ähnlichen Situation würden wir dann wieder so handeln, weil uns unser Bauchgefühl sagt, dass es wir gemäß der Erfahrung handeln sollten.

      Ich persönlich versuche konzentriert jede einzelne Situation (also nur die bei den ich vor "grösseren" Entscheidungen stehe, eg. All in / All in call) als eine einzelne NEUE Situation zu sehen.

      Ich höre dabei nicht auf mein Bauchgefühl, das mir nämlich nur das sagen wird, was es aus Erfahrung ähnlicher oder gleicher Situationen "gelernt" haben. War das Ergebnis der Erfahrung gut, dann wird mein Bauch sagen - lets go!, war das Ergebnis schlecht, wird er sagen, FOLD omg FOLD!

      Wenn wir aber versuchen, eben dieses Bauchgefühl zu unterdrücken und uns klaren Kopfes auf diese eine aktuelle Situation konzentrieren, werden wir einige Details entdecken, die unser Bauchgefühl ignoriert hat. Und eben diese kleinen Details beeinflussen die Entscheidung über All in und Fold ganz gewaltig.


      Hoffe das ist einigermaßen verständlich und richtig, ich bin keine Psychologe ^^
    • wespetrev
      wespetrev
      Bronze
      Dabei seit: 14.01.2008 Beiträge: 2.384
      Original von bensonv5


      Hoffe das ist einigermaßen verständlich und richtig, ich bin keine Psychologe ^^
      Ich hab's verstanden und finde es richtig. =)