spiegel artikel: bayes modell

    • xyceat
      xyceat
      Bronze
      Dabei seit: 26.07.2007 Beiträge: 619
      Ein kleiner Auszug aus diesem Artikel:

      Die scheinbar einfache Prozentrechnung hat den Professor in die Irre geführt. Eigentlich müsste er nämlich das sogenannte Bayes-Modell aus der Wahrscheinlichkeitstheorie anwenden. Mit dessen Hilfe kann man bestimmen, wie sich die Wahrscheinlichkeit eines Ereignisses ändert, wenn man neue Informationen bekommt.
      kann mir jemand den mathematischen hintergrund dazu erläutern oder hat jemand einen passenden link? google hat mir auf die schnelle nicht geholfen und ich finde das dargestellte problem interessant :)
  • 8 Antworten
    • superstar84
      superstar84
      Bronze
      Dabei seit: 24.04.2006 Beiträge: 1.925
      Ein Beispiel und die Regel von Bayes


      Ein Beispiel
      In einer großen deutschen Studentenstadt gebe es zwei Arten von Fahrrädern: Makellos schwarz lackierte sowie sich in einem bemitleidenswerten Zustand befindende rostbraune . 95% aller Fahrräder sind rostbraun. Eines Nachts wird ein Fußgänger von einem Radfahrer angefahren, der Radfahrer begeht Fahrerflucht. Das Fahrvermögen der Radfahrer als auch deren moralischen Einstellungen ist unabhängig von der Farbe des Rades. Ein grade zum Zwecke der Wohnungssuche in der Stadt angekommener Zeuge sagt aus, dass das betreffende Fahrrad schwarz war. Der Zeuge kennt die jeweiligen Anteile schwarzer und rostbrauner Fahrräder in der Grundgesamtheit nicht. Er tätigt seine Aussagen ausschließlich auf Basis seiner Beobachtungen. Da der Unfall bei Nacht geschah, ist man sich der Verlässlichkeit der Zeugenaussage nicht sicher, allerdings weiß man aus Erfahrung dass derartige Zeugenaussagen in vier von fünf Fällen korrekt sind (unabhängig von der Farbe des Verursacherfahrrades).
      Was können wir nun aus der vom Zeugen gelieferten Information schließen? Ist es wahrscheinlich, dass ein schwarzes Fahrrad am Unfall beteiligt war? Obwohl der Zeuge dies aussagt und in 80% aller Fälle richtig liegt, ist dem nicht so: Die Zeugenaussage „das Fahrrad war schwarz“ kann zum einen durch das Ereignis „das Verursacherfahrrad war schwarz (ein Ereignis mit geringer a priori Wahrscheinlichkeit: 0,05) und wird korrekt identifiziert (ein Ereignis mit hoher a priori Wahrscheinlichkeit: 0,8)“ als auch durch das Ereignis „das Verursacherfahrrad war rostbraun (mit hoher a priori Wahrscheinlichkeit: 0,95) und wurde falsch identifiziert (mit geringer a priori Wahrscheinlichkeit: 0,2)“ hervorgerufen werden. Mit Hilfe der Regel von Bayes kann nun die (bedingte) Wahrscheinlichkeit des Ereignisses „das Fahrrad ist schwarz und wurde korrekt identifiziert“ berechnet werden. Sei S das Ereignis „das Verursacherfahrrad war schwarz“ und sei R das Ereignis „das Verursacherfahrrad war rostbraun“. Darüber hinaus sei s (r) die Zeugenaussage „das Verursacherfahrrad war schwarz (rostbraun)“. Die Wahrscheinlichkeit dass das Verursacherfahrrad schwarz war und korrekt identifiziert wurde ist folglich P(S│s). Mit Hilfe der Regel von Bayes für die Berechnung bedingter Wahrscheinlichkeiten folgt:


      (1) P(S│s)=(P(s│S)*P(S))/(P(s))=

      (P(s│S)*P(S))/(P(s│S)*P(S)+P(s│R)*P(R))=

      =(P(s│S)*P(S))/(P(s│S)*P(S)+P(s│R)*(1-P(S)))



      Die Wahrscheinlichkeit, dass das Verursacherfahrrad schwarz war beträgt in Abwesenheit einer etwaigen Zeugenaussage P(S)=0.05, die Wahrscheinlichkeit einer korrekten Identifizierung P(s│S)=0.8, die einer falschen Identifizierung P(r│S)=0.2. Daraus folgt:

      (2) P(S│s)=(0.8*0.05)/(0.8*0.05+0.2*0.95)=0.04/0,23=4/23

      Mit anderen Worten: trotz der Zeugenaussage „das Verursacherfahrrad war schwarz“ und der Tatsache dass diese Aussage in 80% aller Fälle korrekt ist, beträgt die a posteori Wahrscheinlichkeit lediglich 4/23, ist also deutlich geringer als die achtzigprozentige Sicherheit des Zeugen intuitiv vermuten ließe. Grund ist die geringe Wahrscheinlichkeit einer richtigen Identifizierung eines schwarzen Fahrrades im Verhältnis zu der Wahrscheinlichkeit einer falschen Identifizierung eines rostbraunen Fahrrades.
      Dieses Beispiel ist eine intuitive Darstellung der Grundprinzipien Bayesschen Lernens: die Veränderung der a-priori Wahrscheinlichkeiten („das Verursacherfahrrad war schwarz/rostbraun“) durch die Realisation eines bestimmten Signales (Zeugenaussage: „Das Verursacherfahrrad war schwarz“) mit ex ante festgelegter Präzision (im Beispiel 0.8). Gleichzeitig werden allerdings auch die möglichen Probleme deutlich, die Individuen in der Realität bei der Anwendung der Regel von Bayes haben könnten. Ob Menschen tatsächlich in der Lage sind, die Regel von Bayes bei alltäglichen Problemen zu nutzen, wurde unter anderem von Hold und Anderson (1996,1997) unter Laborbedingungen getestet. Sie kommen zu dem Ergebnis, dass in der Mehrzahl der Fälle die Probanden Bayes Regel korrekt anwendeten bzw. ihr Verhalten mit den mit Hilfe der oben genannten Regel berechneten bedingten Wahrscheinlichkeiten kompatibel war.


      Der Satz von Bayes:


      Die Regel für die Berechnung von bedingten Wahrscheinlichkeiten ergibt sich aus dem Satz von Bayes (siehe z.B. Kleiber, 1981):

      Sei P(B) die Wahrscheinlichkeit des Ereignisses B. Dann folgt:


      〖〖〖(3) P(B)=P(B)*1=P(B)*(P(A|B)+P(A〗^c |B) )
      =P(B)*P(A|B)+P(B)*P(A〗^c |B)=
      P(B|A〗^c)*P(A^c )+P(A)*P(A|B)
      Dabei beschreibt A^c das Komplementärereignis zu A. Nach Umstellen der Gleichung ergibt sich die bereits in (1) angewandte Formel:


      (4) P(A│B)=
      (P(B│A)*P(A))/(P(B│A)*P(A)+P(B│A^c )*P(A^c))
    • xyceat
      xyceat
      Bronze
      Dabei seit: 26.07.2007 Beiträge: 619
      die formel von bayes zur berechnung bedingter wahrscheinlichkeiten ist mir bekannt... allerdings verstehe ich die anwendung dieser regel auf das im artikel beschriebene problem nicht :f_confused:


      hier noch mal die gesamte aufgabe für alle, die den link nicht anklicken wollen:
      Ein Professor möchte monatlich 1000 Euro in einen Rentenfonds investieren und hat zwei zur Auswahl, Fidelity und Goodlife. Nun möchte er jenen auswählen, der die bessere Rendite verspricht. Er informiert sich bei verschiedenen Quellen. Seine erste Quelle bewertet Fidelity besser und lag in der Vergangenheit bei ähnlichen Bewertungen zu 80 Prozent richtig. Eine zweite Quelle bewertet ebenfalls Fidelity besser, lag aber mit ihren Prognosen bisher nur in 70 Prozent der Fälle richtig.

      Weil es relativ einfach ist, mit Prozentzahlen dieser Art zu rechnen, bildet der Professor den Durchschnittswert - wie es wohl viele Verbraucher tun würden. Er setzt also zu 75 Prozent auf Fidelity. Er überweist monatlich 750 Euro an diesen Fonds, und an Goodlife gehen 250 Euro.

      Genau das ist falsch.

      Die scheinbar einfache Prozentrechnung hat den Professor in die Irre geführt. Eigentlich müsste er nämlich das sogenannte Bayes-Modell aus der Wahrscheinlichkeitstheorie anwenden. Mit dessen Hilfe kann man bestimmen, wie sich die Wahrscheinlichkeit eines Ereignisses ändert, wenn man neue Informationen bekommt. Der Ansatz ist recht intuitiv: Die Tatsache, dass eine zweite unabhängige Quelle zur selben Einschätzung gelangt ist wie die erste, sollte den Professor eigentlich noch stärker in Fidelity bestärken - auch wenn die zweite Quelle etwas weniger glaubwürdig ist als die erste. Nach dem Bayes-Modell müsste der Professor 90,32 Prozent in Fidelity investieren. Mit 75 Prozent dagegen vertraut er der vermutlich erfolgreicheren Firma nicht genug.
      ich wüsste gerne, wie man auf die angegebene lösung von 90,32 prozent kommt
    • itbmotw
      itbmotw
      Bronze
      Dabei seit: 03.03.2007 Beiträge: 2.426
      Hab jetzt ein wenig überlegt und ein wenig gegoolt und glaube das Bayes-Modell ist nicht einfach nur der Satz von Bayes wie oben angenommen, sondern wirklich eine Art Hypothesentest aus der Statistik (wenn auch auf diesem Satz aufbaut), eine Erklärung würde mich auch interressieren, hab nämlich nicht wirklich eine Ahnung wie ich vorgehen soll.
    • Merlinius
      Merlinius
      Platin
      Dabei seit: 30.06.2006 Beiträge: 3.519
      Ich kenne das Modell leider nicht, aber dieses Beispiel im Text ist ja völlig bescheuert. Wer ist denn so dumm und bildet dann den Mittelwert aus den beiden Prozentzahlen. Wenn sich Quelle A zu 100% sicher ist und Quelle B einfach ne Münze wirft, also 50% sicher, dann wäre die Gesamtsicherheit doch auch nicht 75% :facepalm:
    • MadCow
      MadCow
      Bronze
      Dabei seit: 15.09.2006 Beiträge: 1.151
      Original von itbmotw
      Hab jetzt ein wenig überlegt und ein wenig gegoolt und glaube das Bayes-Modell ist nicht einfach nur der Satz von Bayes wie oben angenommen, sondern wirklich eine Art Hypothesentest aus der Statistik (wenn auch auf diesem Satz aufbaut), eine Erklärung würde mich auch interressieren, hab nämlich nicht wirklich eine Ahnung wie ich vorgehen soll.
      Gemeint wird sein das wenn man die wahrscheinlichkeit mit dem bayeschen wahrscheinlichkeitsbegriff berechnet kommt 90.32 raus.

      Wenn man einen anderen z.b. den frequentistischen wahrscheinlichkeitsbegriff verwendet kommt vermutlich was anderes raus.

      http://en.wikipedia.org/wiki/Bayesian_inference
      http://en.wikipedia.org/wiki/Frequentist
    • pokersille
      pokersille
      Bronze
      Dabei seit: 28.01.2008 Beiträge: 565
      die brücke zu bayes krieg ich nicht gebaut, aber der berechnete wert ergibt sich folgendermaßen:

      P(beide richtig) / ((P beide richtig) + P(beide falsch)) = .7 * .8/(.7 * .8 + .3 * .2)
    • Grinsefisch
      Grinsefisch
      Bronze
      Dabei seit: 17.12.2008 Beiträge: 1.036
      Bayes Law:

      P(beide haben den selben Fav | beide richtig) = 1
      P(beide richtig) = (0.7 * 0.8)
      P(beide haben den selben Fav) = (0.7 * 0.8 + 0.3 * 0.2)

      => P(beide richtig | beide haben den selben Fav) = 1 * (0.7 * 0.8) / (0.7 * 0.8 + 0.3 * 0.2)

      Aber jetzt erklär mir mal bitte jemand warum der Professor seine Einlagen genau nach dieser Wahrscheinlichkeit aufteilen will? Ist doch auch nur eine willkürliche Verteilung. Kann doch genausogut 100:0 oder 75:25 machen...

      PS: Eigentlich ist das Aufgabenbeispiel ganz grausam gewählt, da man nicht davon ausgehen kann dass beide Quellen absolut unabhängig zufällig auf das selbe Ergebnis gekommen sind. Sie werden ja schließlich beide die Daten der beiden Fonds auswerten und deshalb nicht total unabhängig auf ein Ergebnis kommen.
    • churib
      churib
      Bronze
      Dabei seit: 08.09.2006 Beiträge: 465
      Bei Wikipedia gibt es das oft zitierte Beispiel mit den Wahrscheinlichkeit, eine seltene Krankheit zu haben: Auf eine Person wird ein Test angewandt, der mit einer recht hohen Trefferquote diese Krankheit feststellt (--> Google it). Ich finde, das ist ein recht gutes Beispiel fuer das Bayes Law.

      Ich beschaeftige mich gerade mit Postionsbestimmung, zum Beispiel: Die Position eines Roboters im Raum soll ermittelt werden, die Postition kann nicht direkt gemessen werden, aber der Roboter hat eine Karte des Raumes und Sensoren, mit denen er Abstaende zu den Waenden/Hindernissen ermitteln kann.
      Hier laesst sich die Position probabilistisch ermitteln: Man hat eine Wahrscheinlichkeitsverteilung darueber, wo sich der Roboter befindet. Mit jeder Messung der Sensoren wird die Wahrscheinlichkeitsverteilung mit Hilfe des Bayes-Law neu angepasst.
      Hier zeigt sich die Staerke des Bayes-Law: Die Position des Roboters ist nicht direkt messbar, aber er kann sie aus den Sensormessungen schaetzen. (--> Hidden Markov Modell erster Ordnung)