Buchtipps:

Gero von Randow: Das Ziegenproblem. Denken in Wahrscheinlichkeiten
Ihr nehmt an einer Spielshow teil, bei der Ihr eine von drei verschlossenen Türen auswählen sollt. Hinter einer Tür wartet der Preis, hinter den beiden anderen Ziegen. Der Moderator weiß, hinter welcher Tür das Auto ist; er öffnet eine andere Tür, z.B. Nummer drei, und eine Ziege schaut ins Publikum. Er fragt: "Bleiben Sie bei Nummer eins, oder wählen Sie Nummer zwei?" Ist es nun egal, ob wann bei der Tür bleibt oder wechselt? Auch mehr als 10 Jahren nach Erscheinen lässt "Das Ziegenproblem" Köpfe rauchen.

Clauß, Günter/Finze, Falk-Rüdiger/Partzsch, Lothar: Statistik Grundlagen
Das habe ich zusätzlich zum Lernen benutzt und es hat mir ganz gut geholfen.

Krämer, Walter: Statistik verstehen. Eine Gebrauchsanweisung.
Und hier Statistik nochmal ganz einfach erklärt. Mit diesem kleinen Taschenbuch kann man sich erst einmal einen Durchblick verschaffen, bevor es an die Formeln geht.

Teststärke und Poweranalyse

Power: 1 - β

Eine Power von weniger als 0,8 ist unzureichend. Also darf β nicht größer als 0,2 sein.
(bedingte Wahrscheinlichkeiten!)

α-Fehler: Man übersieht die Gleichheit.
β-Fehler: Man übersieht den Unterschied

Die Power hängt ab von:

  • Signifikanzniveau
  • Stichprobengröße N
  • Populationsvarianzen


Von der Differenz der Erwartungswerte der verglichenen Populationen (μ1 - μ 2)

Je größer α, desto größer ist 1 - β
Wenn die Fläche unter der ersten Kurve, die α abteilt, größer wird, dann wächst
auch die Fläche von 1 - β unter der zweiten Kurve.

Je kleiner σ, desto größer ist 1 - β
Wenn σ kleiner wird, wird die Kurve steiler. Wenn dies bei beiden Kurven
Bei gleichbleibenden Mittelwert geschieht, wird die überschneidende Fläche kleiner.

Je größer μ1 - μ 2, desto größer ist 1 - β
Wenn der Abstand zwischen den beiden Kurven größer wird, verkleinert sich der Überschneidungsbereich.

Effektgröße d:


Je kleiner die Stichprobe ist, desto größer muß d (der Effekt) sein, um einen Unterschied finden zu können.
Man bezeichnet d = 0,2 als kleinen, d = 0,5 als mittleren und d = 0,8 als großen Effekt.
Die Größe der Power hat bei d = 0 inhaltlich keine Aussagekraft.

Je größer α ist, desto größer ist 1 - β
Je größer N ist, desto größer ist 1 - β
Je kleiner σ ist, desto größer ist 1 - β
Je größer ‌ μ1 - μ 2 ‌ ist, desto größer ist 1 - β
Je größer d ist, desto größer ist 1 - β

Ist der Test nicht signifikant, muß die Effektgröße berechnet werden.
War der Test signifikant, muß die Power berechnet werden.

Poweranalyse

Verfahren, bei dem man mit Hilfe von α und β, der Effektgröße d und des Stichprobenumfangs entweder vor einer Untersuchung gut planen oder nach der Auswertung die Ergebnisse diskutieren kann.

Bei der Versuchsplanung:
d, α und β festlegen, danach mit Hilfe von Testcharakteristiken (Tabelle Seite 13)
N bestimmen.

Nach der Durchführung:
War der Test signifikant, kann aus den Daten die Effektgröße geschätzt werden. Beim t-Test wird μi durch ‾xi und σ durch s geschätzt. Dann hat man die Möglichkeit zu diskutieren, ob der Unterschied inhaltlich bedeutsam ist.

War der Test nicht signifikant und ist H0 die wesentliche Aussage der Hypothese, muß berechnet werden, wie groß bei dem benutztem N und der geschätzten Effektgröße die Teststärke war, denn hier ist ja der β-Fehler wichtig.

Wenn H1 aber die Hypothese war, die nun leider nicht herausgekommen ist, kann man feststellen, ob die Vpn-Zahl erhöht werden kann. Dafür wird die tatsächliche Effektgröße geschätzt. Dann fragt an sich, ob diese Effektgröße inhaltlich bedeutsam ist, wenn ja, berechnet man die Stichprobengröße, die bei akzeptablem β diesen Effekt signifikant gemacht hätte. Dann wird mit diesem N nochmal begonnen.

Ist der Test nicht signifikant, muß die Effektgröße berechnet werden.
War der Test signifikant, muß die Power berechnet werden.