Streuungen (Forschung)

dlsasv @, Freitag, 09.10.2009, 01:05 (vor 5523 Tagen) @ Alexander Lerchl

Das liegt zum einen daran, dass man die relativen Schwankungen nicht einfach gleichsetzen kann, ohne die Gewichtungen zu berücksichtigen (das rechte Bild sähe völlig anders aus, wenn die Gewichtung für die A-Zellen 0 oder 5 statt 2,5 wäre!), zum anderen natürlich daran, dass die Schwankungen insgesamt zu klein sind. "Korrigierende Korrelationen" spielen eher eine kleine Rolle.

Ich verstehe ja, dass Sie ein kenntnisreicher Advocatus diaboli sind :-). Aber schauen Sie sich mal folgendes Bild an:

[image]

Ich habe hierzu die ersten 20 Zeilen mit den Zellzahlen der Tabelle ("Statistik") analysiert, indem die Zellzahlen mit den jeweiligen Kalibrierungsfaktoren multipliziert wurden. Die Summe aller Produkte, geteilt durch 500, ergibt den Comet Tail Faktor.

Die Grafik zeigt für diese 20 Beispiele den relativen Beitrag jeder Zelle an der Summe. Man sieht, dass die Varianzen (bis auf die Beiträge der A-Zellen)erheblich sind. Dennoch sind die CTF-Werte (kleine Grafik) sehr ähnlich. Wie würden Sie das erklären?

Dann also mal im Detail: Der 500-fache CTF-Wert ist die Summe der Zahlen der Zellen in den Kategorien A - E, multipliziert mit den Kalibrierungsfaktoren,
500*CTF = GA + GB + GC + GD + GE.

Für die Varianzen sollte man erwarten dürfen (die Kovarianzen sollten vernachlässigbar sein):
Var(500*CTF) = Var(GA) + Var(GB) + Var(GC) + Var(GD) + Var(GE)

Worauf Sie hinaus wollen ist, dass die rechte Seite größer ist als die linke.

Also mal nachsehen für die ersten 20 Zeilen, ich komme auf:

Var(500*CTF) = 8640

Var(GA) = 90
Var(GB) = 1600
Var(GC) = 1980
Var(GD) = 6280
Var(GE) = 7400
-------------------
Summe = 17350

Sie haben Recht, die rechte Seite ist tatsächlich um den Faktor 2 größer als die linke. Die Streuung (Wurzel) demnach um 40%. Mit bloßem Auge fände ich das schwierig zu sehen.

Aber die entscheidende Frage ist, ob so ein Unterschied statistisch auffällig ist. Wenn ich mich nicht versimuliert habe, dann nicht, denn die Wahrscheinlichkeit, dass soetwas zufällig passiert, läge bei etwa 6% für die ersten 20 Zeilen und bei 14% für alle 60.


gesamter Thread:

 RSS-Feed dieser Diskussion

powered by my little forum