Hypothesen-test

    • Carty
      Carty
      Bronze
      Dabei seit: 17.05.2006 Beiträge: 11.791
      hallo,
      folgendes:
      wir haben eine umfrage gemacht (zum ankreuzen). unser prof will das wir hypothesen tests einbauen. leider hab ich garkeine ahnung auf was man da testet :(

      so sah unsere umfrage aus (gekürzt)

      1. Durch welche Medien bist du bisher auf die Kampagne aufmerksam geworden?
      (mehrere Antworten möglich)

      1. durch StudiVZ, MeinVZ
      2. durch Facebook, Twitter, Blogs
      3. durch Banner auf anderen Webseiten
      4. durch Offline-Medien (Fernsehen, Zeitungen, Magazine, Radio etc.)
      5. weiß nicht mehr

      2. Hast du dir bereits das Produkt gekauft? (ja/nein)

      3. Würdest/Willst du dir das Produkt kaufen?

      1. Ja, das werde ich mit Sicherheit tun.
      2. Ja, vielleicht werde ich das tun.
      3. Ich weiß nicht.
      4. Nein, aber ein anderes Modell von Audi vielleicht.
      5. Nein, ich würde keinen Audi kaufen.
      6. Nichts davon.


      wir habe ingesamt 20 test, verschickt hatten wir 100.

      interessant sind eigentlich nur die antwort 1.1 in verbindung mit 2. ja oder 3.1/3.2./3.4

      kann man da jetzt irgendwie auf zufall untersuchen?bzw. irgendwie versuchen einen rückschluss auf die grundgesamtheit zu schließen (das is ja das was wir haben wollen..)

      könnt ihr mir einen ansatz geben?

      danke schonmal =)
  • 18 Antworten
    • ahly
      ahly
      Gold
      Dabei seit: 13.09.2007 Beiträge: 144
      Was meinst du mit Hypothesen Tests einbauen?
    • Carty
      Carty
      Bronze
      Dabei seit: 17.05.2006 Beiträge: 11.791
      Original von ahly
      Was meinst du mit Hypothesen Tests einbauen?
      ich hab halt keine ahnung ... es geht darum das sample zu testen auf irgendwas ... deswegen frag ich ja hier wie man da vorgeht ... ;(
    • ahly
      ahly
      Gold
      Dabei seit: 13.09.2007 Beiträge: 144
      Du stellst erstmal Hypothesen auf, also Vermutungen wie:

      Vp die über Studivz aufmerksam geworden sind kaufen eher ein Audi als Vp die über offline Medien aufmerksam geworden sind.

      Irgendwelche Vermutungen wirst du doch haben?
    • Faron
      Faron
      Bronze
      Dabei seit: 14.05.2006 Beiträge: 209
      Na du könntest z.B. untersuchen, ob es einen Unterschied bzgl. der tatsächlichen Einkäufe (Frage 2, Antwort "ja") macht, über welche Plattform man auf das Produkt aufmerksam wurde.
      Also z.b. 'nen zweistichproben t-test oder eine Varianzanalyse (ANOVA).
    • FiftyBlume
      FiftyBlume
      Bronze
      Dabei seit: 06.06.2010 Beiträge: 8.580
      Original von Carty
      Original von ahly
      Was meinst du mit Hypothesen Tests einbauen?
      ich hab halt keine ahnung ... es geht darum das sample zu testen auf irgendwas ... deswegen frag ich ja hier wie man da vorgeht ... ;(

      Hypothesentest.....google oder wikipedia:)

      Ist halt ne ganz normale Sache bei Umfragen, du suchst ein Konfidenzintervall, um zu bestimmt wie represäntativ deine Umfrage ist.

      Läuft so ähnlich ab wie bei der Frage: "Wie viele Hände sind aussagekräftig?"


      Du musst halt abschätzen, in welchen Bereichen die Antworten vermutlich liegen(%-tuale Auswertung vorausgesetzt).
    • smieze
      smieze
      Bronze
      Dabei seit: 18.11.2010 Beiträge: 116
      Öhm.. erst Fragebogen machen und DANACH überlegen, was man eigentlich rausfinden will? Interessanter Ansatz vom Prof :D

      @Faron: Wie willst du ne ANOVA machen, wenn AV und UV nominalskaliert sind? Steh ich da grade aufm Schlauch? :s_confused:
    • Faron
      Faron
      Bronze
      Dabei seit: 14.05.2006 Beiträge: 209
      Original von smieze
      Öhm.. erst Fragebogen machen und DANACH überlegen, was man eigentlich rausfinden will? Interessanter Ansatz vom Prof :D

      @Faron: Wie willst du ne ANOVA machen, wenn AV und UV nominalskaliert sind? Steh ich da grade aufm Schlauch? :s_confused:
      Nein, stehst du nicht. Da war ich leider etwas voreilig.
      Logistsche Regression sollte passen.
    • Carty
      Carty
      Bronze
      Dabei seit: 17.05.2006 Beiträge: 11.791
      Original von ahly
      Du stellst erstmal Hypothesen auf, also Vermutungen wie:

      Vp die über Studivz aufmerksam geworden sind kaufen eher ein Audi als Vp die über offline Medien aufmerksam geworden sind.

      Irgendwelche Vermutungen wirst du doch haben?
      genau das ist unsere vermutung ... aber ich hab null plan wie man das dann weiter macht :f_cry:
    • Carty
      Carty
      Bronze
      Dabei seit: 17.05.2006 Beiträge: 11.791
      so wir haben jetzt 20 tests ...

      ich kann jetzt durchschnittsalter, varianz des alters etc. berechnen

      aber was ich gerne wissen würde ist, von den 20 tests ist jetzt einer der durch studivz aufmerksam geworden ist und sich den a1 gekauft hat ...

      wie kann ich das jetzt hochrechnen? (umfrage haben wir an fans einer studivz seite geschickt, insgesamt hat die 50.000 fans) ... geht das irgendwie? ich kann ja jetzt schlecht sagen 5% aller fans haben sich den audi gekauft ... wie mache ich dass, das die umfrage repräsentativ ist?
    • FiftyBlume
      FiftyBlume
      Bronze
      Dabei seit: 06.06.2010 Beiträge: 8.580
      Sicher, dass du im richtigen Fach unterwegs bist?

      bin gerade zu faul dir das rauszusuchen, aber such mal nach
      "Signifikanzniveau" und "Stichprobenumfang"....irgendwo sollte ne Formel sein, die dir zu deiner Hypothese(xx% machen dies) sagt, wie viele Stichproben du brauchst.
      http://de.wikipedia.org/wiki/Zufallsstichprobe

      Zieh dir das mal rein, is eigentlich grundlage stochastik:)
    • itbmotw
      itbmotw
      Bronze
      Dabei seit: 03.03.2007 Beiträge: 2.426
      für die Hypothese: Vp die über Studivz aufmerksam geworden sind kaufen eher ein Audi als Vp die über offline Medien aufmerksam geworden sind.

      Nullhypothese: Das Merkmal (Studivz,offline Medien) ist unabhängig vom Merkmal (Kauf, nicht Kauf).
      Alternative: Das Merkmal Studivz erhöht die Wahrscheinlichkeit, dass das Produk gekauft wird.

      Würde hier folgenden Test für probieren:

      http://de.wikipedia.org/wiki/Exakter_Test_nach_Fisher

      Sollte ein passender Test für das Problem sein, fürchte aber das n=20 einfach deutlich zu gering ist, gerade bei der niedrigen Wahrscheinlichkeit, dass überhaupt einer das Produkt kauft.



      wie kann ich das jetzt hochrechnen? (umfrage haben wir an fans einer studivz seite geschickt, insgesamt hat die 50.000 fans) ... geht das irgendwie? ich kann ja jetzt schlecht sagen 5% aller fans haben sich den audi gekauft ... wie mache ich dass, das die umfrage repräsentativ ist?


      Repräsentativ für welche Grundgesamtheit? Denke aber bei 20 Umfragen kann man das eh vergessen.
      Hochrechnen, hmm, denke Konfidenzintervall ist das was du meinst, schreib mal bitte ein paar mehr Infos, damit man etwas über die Verteilung sagen kannst, spontan würde ich eine Binomialverteilung vermuten, die wir hier bei der geringen Größe nicht über eine Normalverteilung approximieren können, müsstest wenn mal nach einer exakten googln.
    • Carty
      Carty
      Bronze
      Dabei seit: 17.05.2006 Beiträge: 11.791
      hmm hab das jetzt mit tests alles verworfen und mit bedingten wahrscheinlichkeiten gerechnet (baye) ... die ganzen t und f test basieren doch alle auf normalverteilung, und seit wann ist denn das menschliche gehirn normalverteilt :D

      hab jetzt dann rausgefunden dass je mehr medien jemand nutzt, desto größer ist die erwartete anzahl der bewertungspunkte E(Y | X = xi , wobei xi die anzahl der genutzten medien ist)
      (1-7, je höher desto besser, 4 kategorien: jung, modern, innovativ, überlegen)


      macht das sinn so? :D
    • ahly
      ahly
      Gold
      Dabei seit: 13.09.2007 Beiträge: 144
      Kannst du auch mit einer Regression machen ala y(Bewertungspunkte)=a*x(Anzahl der Medien)+b.
      Das positive ist: du kannst einen Graph zu zeichnen und evtl. noch andere Faktoren z.B.Häufigkeit der Nutzung, Einkommen mit einbeziehen (y=ax+bz(neuer Faktor)+c). Und es ist sehr einfach in SPSS.

      Vorher die Daten z-standardisieren+Vorraussetzungen prüfen.

      ps. die Kategorien versteh ich noch nicht. Bewertungspunkte in den 4 Kategorien? Wenn ja noch besser, da 5 Graphen(4*einzel+gesamt)+mehr Ergebnisse+mehr eindruck beim prof
    • Danhel
      Danhel
      Moderator
      Moderator
      Dabei seit: 09.10.2007 Beiträge: 4.076
      bootmarked ;)
    • Carty
      Carty
      Bronze
      Dabei seit: 17.05.2006 Beiträge: 11.791
      Original von ahly
      Kannst du auch mit einer Regression machen ala y(Bewertungspunkte)=a*x(Anzahl der Medien)+b.
      Das positive ist: du kannst einen Graph zu zeichnen und evtl. noch andere Faktoren z.B.Häufigkeit der Nutzung, Einkommen mit einbeziehen (y=ax+bz(neuer Faktor)+c). Und es ist sehr einfach in SPSS.

      Vorher die Daten z-standardisieren+Vorraussetzungen prüfen.

      ps. die Kategorien versteh ich noch nicht. Bewertungspunkte in den 4 Kategorien? Wenn ja noch besser, da 5 Graphen(4*einzel+gesamt)+mehr Ergebnisse+mehr eindruck beim prof
      nein ich kann keine regression machen, weil ich dann ja wieder davon ausgehe dass die punkte um der regressiongraden normalverteilt sind (quadrierter abstand -> egal ob der punkt ober oder unter der grade liegt, da abstand quadriert wird) .. und diese annahme ist halt humbug ^^


      also man konnte punkte vergeben von 1-7 (1= stimme nicht zu, 7 = stimme voll zu), dann gabs vier kategorien:
      ich finde xy jung
      ich finde xy modern
      ich finde xy innovativ
      ich finde xy überlegen (ggü anderen (homogenen) produkten)

      so jetzt hat derjenige jeweils punkte vergeben, die habe ich addiert = gesamtpunktzahl ... habe nun geschaut wie hoch die erwartete gesamtpunktzahl ist wenn man jemanden rauspickt der nur ein medium, 2 medien, 3 medien benutzt hat (bedingte wahrscheinlichkeiten) ...

      so die E(Y|X = xi) steigen mit steigener medienanzahl -> jetzt kann ich die regressieren und fertig...?!
    • ahly
      ahly
      Gold
      Dabei seit: 13.09.2007 Beiträge: 144
      [quote]Original von Carty


      nein ich kann keine regression machen, weil ich dann ja wieder davon ausgehe dass die punkte um der regressiongraden normalverteilt sind (quadrierter abstand -> egal ob der punkt ober oder unter der grade liegt, da abstand quadriert wird) .. und diese annahme ist halt humbug ^^

      Den Punkt versteh ich leider nicht. Punkte müssen um die Gerade Normalverteilt sein?

      Voraussetzungen Regressionsanalyse:

      Daten müssen intervallskaliert sein. Sind sie

      Beziehung zwischen X+Y ist linear. Kannst du hinterher checken, macht aber auch Sinn im konkreten Fall

      Hinzu kommt
      achtung random Google Skript (http://kappelhoff.wiwi.uni-wuppertal.de/fileadmin/kappelhoff/Downloads/Vorlesung/regression.pdf)

      "1. Für jede Wertekombination der unabhängigen Variablen ist das ermittelte Residuum (Y Y i i - $ ) eine
      Realisation einer normalverteilten Zufallsvariablen.

      2. Sämtliche dieser Zufallsvariablen sind paarweise voneinander statistisch unabhängig (unkorreliert)
      und ihre Verteilungen haben alle den Mittelwert 0 und die gleiche Varianz (Homoskedastizität)."


      Das Ganze prüft man hinterher bzw. in SPSS und nicht mittels LogiK. Selbst wenn Voraussetzungen leicht verletzt sind kannst du mit Einschränkungen weitermachen, es muss nur diskutiert werden.

      Mit der Regressionsanalyse machst du es dir viel einfacher, kriegst mehr Ergebnisse, hast mehr zu schreiben, kannst Grafiken einfügen und noch drölf mehr Gründe.

      Ich sage nicht deine Sache ist falsch oder so muss mans machen. Wenn dein Prof. es nicht will mach es bloss nicht, aber meiner Erfahrung nach dürfte das nicht der Fall sein.
    • maestroXXX
      maestroXXX
      Bronze
      Dabei seit: 06.09.2005 Beiträge: 639
      bin bei nem kumpel und poste deshalb unter anderem namen:

      ch weiß was du meinst, und das ist auch der standard ansatz fast aller bücher...aber er ist nicht korrekt ...

      warum die daten normalverteilt seien müssen?

      ganz einfach, überleg doch mal, du minimierst ja die summe der quadrate (errors) ... so in diesem fall ist der abstand zu einem punkt der oberhalb liegt exakt der gleiche als wenn er unterhalb liegt ... d.h. beide punkte sind GLEICHwahrscheinlich, und das is halt nur so bei der gaußschen glocke ... diese annahme funktioniert super toll bei anderen wissenschaften, aber BWL beschäftigt sich ja mit menschlichen verhalten...

      nochmal mit zahlen:

      angenommen du willst sparraten und konsumausgaben regressieren ...
      nehmebn wir an x = konsum und y = sparrate
      jetzt hast du ja verschieden punkte(wolke), da machste jetzt deine regressionsanalyse mit SPSS oder wie auch immer ... jetzt such dir mal ein punkt aus (z.b. niedrigster konsumwert x = 100 euro und sparrate = 0,2) ... dieser punkt liegt jetzt unterhalb der regressionsgraden (wenn die regressionsgrade z.b. in diesem punkt durch 0,3 geht... für die regressionsgrade ist es aber unabhängig ob der punkte oberhalb oder unterhalb liegen würde ... aber ist es gleichwahrscheinlich dass bei x= 100 die sparrate 0,2 und 0,4 ist? (wenn die regressionsgrade durch 0,3 geht)
    • ahly
      ahly
      Gold
      Dabei seit: 13.09.2007 Beiträge: 144
      Das was normalverteilt sein muss ist das hier:

      "1. Für jede Wertekombination der unabhängigen Variablen ist das ermittelte Residuum(also dass was du angesprochen hast) (Y Y i i - $ ) eine Realisation einer normalverteilten Zufallsvariablen."

      Das musst du natürlich testen, aber wie du vorher schon weisst, dass die nicht normalverteilt sind erschliesst sich mir immer noch nicht.
      Regressionsanalysen und menschliches Verhalten funktioniert super, wenn die Annahmen nicht verletzt werden.

      Wenn du die einzelnen Variablen normalverteilt haben willst z-standardisiere sie ( das musst du eh machen willst ja keine äpfel mit birnen vergleichen).

      Ich will dir nichts aufschwatzen, aber ohne wenigstens einmal die Voraussetzungen zu prüfen würde ich die Regressionanalyse nicht verwerfen.

      Edit. selbst bei verletzten Voraussetzungen gibts es Verfahren die Daten zu transformieren oder robuste Regressionen durchzuführen, ausserdem eröffnet es dir erst weitere Analyseschritte wie Moderatoren und Mediatoren in betracht zu ziehen. Gerade bei einem so umfangreichen Fragebogen überwiegen für mich die Vorteile. Und wie gesagt wenn euer prof. nicht drauf steht..... mach nur das was er mag.