WÄhle einen umschlag, gewinne 100 oder 200€ oder verliere 150, lösungsweg plz!

    • OnkelHotte
      OnkelHotte
      Black
      Dabei seit: 16.01.2005 Beiträge: 18.432
      seas zusammen, das gabs schonmal, ich hätte gerne den lösungsweg.

      situation: ich halte dir einen umschlag hin, da sind entweder 100€ oder 200€ drin. du musst den betrag erraten. schaffst du es, gewinnst du den betrag, der drin ist, schaffst du es nicht, muss du mir 150€ zahlen.

      frage: mit welcher frequenz muss ich 100€ oder 200€ in dem umschlag tun, damit ich den besten EV habe.

      lösung: 5/12 200€ und 7/12 100€

      mein wunsch: kann mir jemand dazu nochmal eben den mathematische löungsweg posten?

      das wäre nice = thx!
  • 28 Antworten
    • NoSekiller
      NoSekiller
      Bronze
      Dabei seit: 29.08.2006 Beiträge: 7.727
      Du hast den meißten EV, wenn es egal ist, was der gefragte rät.
      Also muss der EV von der Antwort 100 und der Antwort 200 gleich sein.

      EV(100) = EV(200)

      x sei die Wahrscheinlichkeit dafür, dass 100€ im Umschlag sind.

      EV(100) = x*100 - (1-x)*150
      EV(200) = (1-x)*200 - x*150

      x*100 - (1-x)*150 = (1-x)*200 - x*150
      100x - 150 + 150x = 200 - 200x - 150x
      250x - 150 = -350x + 200
      600x = 350
      x = 7/12
    • OnkelHotte
      OnkelHotte
      Black
      Dabei seit: 16.01.2005 Beiträge: 18.432
      oki, thx! mist, die erste zeile EV (100) = EV (200) darauf bin ich nicht gekommen :(

      danke dir!
    • cjheigl
      cjheigl
      Moderator
      Moderator
      Dabei seit: 09.04.2006 Beiträge: 24.496
      Grad mal ein bischen rumgerechnet: der faire Wert des Spiels ist nur sqr(2) * 100, also 141 Euro und ein paar zerquetschte.
    • YourRedeemer
      YourRedeemer
      Bronze
      Dabei seit: 04.06.2006 Beiträge: 1.384
      Du hast den meißten EV, wenn es egal ist, was der gefragte rät.

      Warum habe ich nicht den höchsten EV wenn ich möglichst wenig in den Umschlag lege?
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      wenn du immer 100 reinlegst kann der andere immer "100" raten und gewinnt deine 100. denn nur wenn er falsch liegt gewinnst du.
    • YourRedeemer
      YourRedeemer
      Bronze
      Dabei seit: 04.06.2006 Beiträge: 1.384
      Ich bin davon ausgegangen, dass nur einmal gespielt wird.
      Der Ansatz, es müsse egal sein was geantwortet wird, ist trotzdem zu einfach. Wäre es nicht besser die Strategie zu ändern, sobald mein Spieler meint ein Muster zu erkennen?
    • cjheigl
      cjheigl
      Moderator
      Moderator
      Dabei seit: 09.04.2006 Beiträge: 24.496
      Glaube ich nicht, und zwar aus zwei Gründen: erstens kann der andere jederzeit seine Strategie ändern und dann wird die eigene Strategie sehr schnell schlechter als die gegnerunabhängige optimale Strategie. Zweitens ist das erkannte Muster vielleicht gar kein Muster. Wenn zum Beispiel der andere eine Zufallsstrategie hat, dann kann es trotzdem sein, dass man ein scheinbares Muster darin erkennt. Nur ist das nicht nur wertlos, sondern dem eigenen Erwartunsgwert sogar abträglich.

      Ob nur einmal gespielt wird oder mehrmals, ändert nichts am Erwartungswert. Nur ziemlich viel an der Varianz.
    • YourRedeemer
      YourRedeemer
      Bronze
      Dabei seit: 04.06.2006 Beiträge: 1.384
      Wenn wir nur einmal spielen ist es auf jeden Fall die beste Strategie 100€ in den Umschlag zu legen, da wir davon ausgehen können, dass unser Spieler gleichwahrscheinlich 100€ oder 200€ rät. Die 5/12 und 7/12 Sache beruht doch darauf, dass wir unserem Spieler keine Möglichkeit geben wollen sich an unsere Strategie anzupassen. Beim ersten Spiel hat unser Spieler doch gar keine Informationen über unsere Strategie!
    • hazz
      hazz
      Black
      Dabei seit: 13.02.2006 Beiträge: 4.771
      ...und wenn er sich in dich hineinversetzt und denkt, dass du genau das denkst, dann kann er auch einfach immer "100" raten.
    • jfuechsl
      jfuechsl
      Bronze
      Dabei seit: 14.01.2006 Beiträge: 791
      Das ganze ist so:
      Wenn unser Gegner mit gleicher Wahrscheinlichkeit 100 oder 200 nimmt, dann können wir das Exploiten, indem wir immer 100er in den Umschlag geben.

      Merkt der Gegner allerdings, dass wir mit dieser Strategie spielen, dann kann er unsere Strategie Counterexploiten indem er immer auf 100 tippt.

      Diese Strategie können wir wieder exploiten, indem wir immer 200er in den Umschlag stecken.

      ...

      Wenn wir allerdings in 7/12*100 Prozent aller Fälle einen 100er reinpacken und in den restlichen Fällen einen 200er, dann kann uns unser Gegner nicht mehr exploiten, da unser EV unabhängig von seiner Strategie ist. (EV(100) == EV(200))

      Eine solche Strategie nennt man optimal.
    • fu4711
      fu4711
      Bronze
      Dabei seit: 29.06.2007 Beiträge: 10.216
      Genau. Natürlich hat man immer einen höheren EV, wenn man es schafft, die Spielstrategie des Gegners zu exploiten - auch oder gerade im Poker. Interessant hier ist aber, daß unser Gegner gegen die von uns gewählte Strategie auf lange Sicht nicht gewinnen kann, egal wie er einseitig seine Strategie wählt (Stichwort: Nash-Gleichgewicht).
      Übertragen auf Poker ist dies eine sehr wichtige Erkenntnis. Bspw. ist es so, daß eine bestimmte Valueline (in Limit z.B. call Flop, checkraise Turn) in einer bestimmten Situation die effektivste, d.h. diejenige mit dem höchsten EV ist, behalten wir aber diese Spielweise bei, so ist es unserem Gegner (nicht kooperatives Spiel) möglich, diese Strategie durch verändern der Eigenen auszunutzen.
      Darum muß man sein Spiel ausbalancieren, indem man ab und zu abweicht. Das Interessante ist nun, herauszufinden, mit welcher Frequenz man von der optimalen Spielweise abweichen muß, um den höchsten EV unabhängig von der Aktion des Gegners zu erzielen. In dem obigen Beispiel müßte man in 5/12 der Fälle abweichen. Im Poker ist eine solche feste Größe natürlich nicht so leicht auszurechnen, aber das stellt ihre Existenz -abhängig von vielen Faktoren- nicht in Frage!
      Zu verstehen, daß ein solches spieltheoretisches Prinzip auch im Poker existiert, halte ich für essentiell, um ein wirklich guter Spieler zu werden.

      Allerdings möchte ich sagen, gottseidank ist es im Poker auf Grund der Komplexität des Spieles (und der Tatsache, daß Rake erhoben wird) (noch) nicht möglich, eine solch mathematisch perfekte Strategie zu finden - dann wäre das Ende zumindest des Onlinepokers gekommen, denn für einen Menschen wäre dann ein Computer nicht mehr schlagbar und das Geld teilen sich Bots und die Anbieter auf.
    • JollyRoger183
      JollyRoger183
      Bronze
      Dabei seit: 03.02.2007 Beiträge: 8.874
      Wie kommt ihr auf EV(100) = EV(200).

      Laut NosekiIIer klingt es so, als würde der Befragte gleich oft 100€ wie 200€ raten, aber warum sollte man das denn tun?
      Wenn du denkst, dass ich das machen würde, dann wüßte ich doch, dass du in 5/12 nur 200 drin hast, und dann würde ich eben bei meinen Antworten auch in 7/12 der Fälle 100 sagen statt 50%.

      Kann es sein, dass das "Nash-GG" für diesen Fall wirklich +-null ist, weil sich die biet- und ratesequenzen immer wieder ausmitteln. Wenn ich weiß was deine Frequenz ist kann ich meine ändern und dich exploiten usw. usw. bis eben 50:50 raus kommt und wir nur unsere Zeit verschwenden mit +-0EV.

      oder verpass ich hier irgendwas? klingt nach nem fairen spiel imo?
    • cjheigl
      cjheigl
      Moderator
      Moderator
      Dabei seit: 09.04.2006 Beiträge: 24.496
      Der Witz bei der 5/12 - 7/12 Strategie ist, dass es völlig egal ist, wie oft du 100 sagst und wie oft 200. Du wirst immer verlieren, selbst wenn du immer 100 bzw. immer 200 sagst oder beliebig abwechselst.

      Mit EV(100)=EV(200 ist genau das ausgedrückt. Egal, ob 100 oder 200 gesagt wird, für den Mann mit dem Briefumschlag ergibt sich immer der gleiche Erwartungswert. Das ist die optimale Strategie, die nicht geknackt werden kann und daraus ergibt sich dann die Verteilung der Geldbeträge in den Umschlag.
    • JollyRoger183
      JollyRoger183
      Bronze
      Dabei seit: 03.02.2007 Beiträge: 8.874
      @cjheigl,

      hm... leuchtet mir noch nciht ein.

      Kannst du EV(100)=EV(200) nochmal in Wort für mich übersetzen - mit der Aussage steht und fällt ja die ganze Erklärung, deswegen wärs schön, wenn du mir das nochmal erklärst.

      Mir scheint es so, als wäre hier eine Strategie entworfen wurden, die auf einer falschen Behauptung fußt.

      Die optimale Strategie, wenn ich immer 200€ sage, wäre ja immer 100€ rein zu tun, und nciht nur 7/12mal.
      Deswegen ist diese 7/12-5/12 Geschichte imo nur richtig, wenn der Rater immer rät und nicht mit ner bestimmten Frequenz antwortet. Und das muss man erstmal beweisen.

      Mal sehen vielleicht fällt mir ja ne "Rate"-strategie ein, mit der ich 7/12-5/12 explointen kann - denke das muss möglich sein.
    • JollyRoger183
      JollyRoger183
      Bronze
      Dabei seit: 03.02.2007 Beiträge: 8.874
      Original von cjheigl
      Grad mal ein bischen rumgerechnet: der faire Wert des Spiels ist nur sqr(2) * 100, also 141 Euro und ein paar zerquetschte.
      woher nimmst du das 2² ?
    • JollyRoger183
      JollyRoger183
      Bronze
      Dabei seit: 03.02.2007 Beiträge: 8.874
      Original von jfuechsl
      Wenn wir allerdings in 7/12*100 Prozent aller Fälle einen 100er reinpacken und in den restlichen Fällen einen 200er, dann kann uns unser Gegner nicht mehr exploiten, da unser EV unabhängig von seiner Strategie ist. (EV(100) == EV(200))
      Eine solche Strategie nennt man optimal.
      Eben das schein ich noch nicht verstanden zu haben... wenn ich jetzt in 7/12 der fälle 100 sage und in 5/12 der fälle 200, dann müsste am Ende doch 0 rauskommen!!!?
    • JollyRoger183
      JollyRoger183
      Bronze
      Dabei seit: 03.02.2007 Beiträge: 8.874
      Sorry - sieht ja fast so aus, als würd ich hier rumspammen.

      Hab mal ein wenig rumgerechnet - und (obwohl es mir im Kopf noch nicht klar ist) verliert man tatsächlich unabhängig von dem was man sagt, und vor allem auch wie oft - bei jedem Raten im Schnitt €4,17.

      Jetzt muss ich nur noch meinen Kopf von den recht simplen Gleichungen überzeugen - oder den Rechenfehler finden ;)
    • JollyRoger183
      JollyRoger183
      Bronze
      Dabei seit: 03.02.2007 Beiträge: 8.874
      So... endlich hab ich ne Lösung die, die bisher von "euch" vorgestellte Theorie zur Lösung des Spiels (also Gewinn fuer den Umschlagvollpacker) anzweifelt.

      Vor 10h sah es fuer mich so aus, wie hier von euch gepostet.
      Annahme ihr presentiert Umschlaege, bei denen im Schnitt zu 5/12 €200 drinn sind und zu 7/12 €100.
      Dann hab ich gerechnet: Ich weiss von der Packweise und sag in 7/12 der Faelle 100€ und in 5/12 200€.
      Dies haette folgendes Ergebnis:
      A (ich sag 100) = (7/12 * 100) + (5/12 * -150) = 58,3 - 62,5 = - 4,2€
      B (ich sag 200) = (5/12 * 200) + (7/12 * -150) = 83,3 - 87,5 = - 4,2€

      Nun scheint es so, als könnte ich, wenn ich immer so rate, wie ich denke, dass die Umschlaege gefuellt sind, trotzdem nicht gewinnen kann.

      Ich denke das selbe Ergebnis wuerde auch raus kommen, wenn ich 50:50 100 oder 200 sage. Kann auch gut sein, dass ich da oben grad falsch gerechnet hab, weil ich mir nicht sicher bin, wie ich rechne, dass ich in so und so vielen Faellen folgendes sage und dann in so und so vielen Faellen auch folgendes Ergebnis kommt, und was dann das Durchschnittsergebnis ist.


      Es ist mir ja immer noch unklar, was ihr genau mit dem (EV(100) == EV(200)) meint. Ich denke es kann auch gut sein, das ihr meint... wenn es egal sein soll, was der Gegner sagt, wie muss ich dann die Umschlaege fuellen, so dass ich den besten erwartungsgewinn habe. Aber ihr habt nirgends bewiesen, dass dieser auch grösser null ist.

      Nun kommt aber mein Gegenbeispiel:

      Ich nehm jetzt mal an, ihr packt in jeden umschlag mit 5/12 prob. €200. Da ihr das mit dieser wahrscheinlichkeit macht, könnte man auch sagen man packt 120 Umschlaege voll und 50 davon enthalten €200 der rest €100 und ich mische dann alle, so dass es relativ zufaellig kommt, was kommt.

      Gleiches könnte man auch mit 12 Umschlaegen machen. Hier also jetzt mein "Extrem"gegenbeispiel.

      Es geht um 12 Umschlaege und ich sage 7mal 100 und 5mal 200.
      Die ersten 7mal, also im schnitt 4mal €100 (ca. 7/12) und 3mal €200 (ca. 5/12).
      Nehmen wir mal an, dass nun zufaellig folgendes passiert. Es kommt 7mal hintereinander zufaellig ein Umschlag zum Vorschein, in dem €100 drin sind.

      Dann verdien ich: 4x €100 und verliere 3mal (wo ich 200 sage) 150 = 400 - 450 = -50€ bin also im Minus. Da ich aber mitgezaehlt habe, was bisher kam, werde ich nun meine Antwortstrategie aendern und die naechsten 5mal eben €200 sagen, da ich weiss, dass die 7 €100ter ja weg sind und gewinne so 800€ bin damit dann €750 im plus.

      Ich habe nun natuerlich ein Extrembeispiel gewaehlt, weil ich die Mathematik nicht verwenden kann um das deutlich zu machen, ABER was klar geworden sein soll... wenn ihr ein System habt mit dem ihr die Umschlaege fuellt, dann kann man seine Antworten eben darauf ausrichten und schauen wie oft schon so und so viele Umschlaege kamen....

      Jetzt kann man natuerlich damit anfangen, dass Glueck und Pech weder in die Vergangenheit noch Zukunft gucken kann und in jedem neuen Umschlag eben wieder zu 7/12 €100 drin sein werden, aber das stimmt bei diesem Beispiel eben nicht...

      Hier wird ja nicht gewuerfelt oder ge-coin-flipped. Hier ist ein rationaler Mind am Werk, der die Umschlaege fuellt, dun das kann ein anderer eben ausnutzen.

      Ich denke ja immer noch, dass das ganze nicht +EV fuer eine Partei sein kann. Fuer mich ein faires Spiel.

      Oder kann mir einer den genauen +EV von dem Spiel sagen. cjheigl hatte da ja mal was ausgerechnet...
    • cjheigl
      cjheigl
      Moderator
      Moderator
      Dabei seit: 09.04.2006 Beiträge: 24.496
      Das Mitzählen bringt dir nichts, da jedesmal neu ausgewürfelt wird, welcher Betrag in den Umschlag gesteckt wird. Das ist wie beim Roulette: wenn bisher 10mal hintereinander rot kam, dann ist die Wahrscheinlichkeit, dass beim nächsten mal rot kommt, immer noch 50%.

      Das, was in 12 Umschlägen drin ist, ist nicht 5 mal 200 und 7 mal 100, sondern im Schnitt 5mal 200 und 7mal 100. Wenn also zufällig 7mal 100 kommt, dann kommt im nächsten Umschlag immer noch zu 7/12 100. Der Mann mit dem Umschlag zählt nämlich nicht mit, wie oft er was reingesteckt hat, sondern entscheidet jedesmal neu, als wäre es das erste Spiel.

      EV(100)=EV(200) entsteht so: gesucht wird eine Strategie, die unabhängig von der Wahl des Spielers (also unabhängig von dessen Strategie) einen Gewinn ergibt. Wenn EV(100)=EV(200), dann haben wir eine solche Strategie gefunden. Allein daraus lässt sich dann ausrechnen, wie oft die Umschläge mit welchem Betrag gefüllt werden müssen.
    • 1
    • 2