Inhalt von Standardabweichung
Definition: Standardabweichung
Die Standardabweichung ist ein ganz grundsätzliches Merkmal von statistischen Auswertungen und wird bei Zufallsvariablen mit „σ“ und bei Stichprobenbetrachtungen mit „s“ angegeben.
Wie die Standardabweichung berechnet wird
Hierfür muss zuerst die Varianz berechnet werden. Die Varianz ist das Quadrat der Differenz zwischen dem Datenpunkt und dem arithmetischen Mittelwert der Stichprobe oder der gesamten Datenpunkte. Es werden alle Quadrate (für jeden Datenpunkt also eines) miteinander addiert.
Anschließend wird der so gewonnene Wert durch n – 1 (bei einer Stichprobenbetrachtung) oder durch N (bei der Betrachtung der Grundgesamtheit) geteilt. Nun liegt die Varianz vor. Die Wurzel der Varianz ist die Standardabweichung.
Konkretes Beispiel zur Berechnung der Standardabweichung bei Betrachtung aller Datenpunkte
15; 17; 9; 12; 12; 18; 14; 19; 11; 10
Zuerst wird der Mittelwert gebildet:
(15 + 17 + 9 + 12 + 12 + 18 + 14 + 19 + 11 + 10) / 10 = 13,7
Die Varianz wird berechnet, indem die Differenz aus Wert und Mittelwert zum Quadrat genommen wird. Hier werden dann die zehn gewonnenen Werte addiert. Dies heißt:
(15 – 13,7)² + (17 – 13,7)² + (9 – 13,7)² + (12 – 13,7)² + (12 – 13,7)² + (18 – 13,7)² + (14 – 13,7)² + (19 – 13,7)² + (11 – 13,7)² + (10 – 13,7)² = 1,69 + 10,89 + 22,09 + 2,89 + 2,89 + 18,49 + 0,09 + 28,09 + 7,29 + 13,69 = 108,1.
Nun wird die Summe durch n – 1 oder N geteilt. Hier wird eine (kleine) Gesamtheit betrachtet, deshalb wird N verwendet. Die Varianz ist:
108,1 / N = 108,1 /10 = 10,81.
Die Wurzel ist die Standardabweichung, also √10,81 = 3,29. Hiermit ist die Standardabweichung für diese Statistik berechnet.
Handelte es sich hingegen um eine Stichprobe, lautet die Berechnung: 108,1 / n – 1 = 108,1 / 9 = 12,01. Die Wurzel ist 3,47 und damit ist die Standardabweichung 3,47.
Der Mittelwert und die Standardabweichung werden als kursives M und kursives SD angegeben. In oberen Falle entspräche dies: M (SD): 13,7 (3,29).
Interpretation der Standardabweichung
Bei der Skala von 9 bis 19 (insgesamt 11 Punkte) lässt sich etwa sagen, dass eine Standardabweichung von 3,29 nicht besonders hoch ist. Sollte die Erhebung zudem der Normalverteilung folgen, lässt sich auch annehmen, dass circa 68 Prozent aller Datenpunkte in diesen Bereich (Wert ≦ 13,7 ± 3,29) fallen. Dies wäre gegebenenfalls zu prüfen, da die Anzahl erhobener Datenpunkte recht klein und nur des Beispiels wegen so gewählt war.
Bei einer hohen Standardabweichung ist es hingegen so, dass wahrscheinlich keine Normalverteilung vorliegt. Dies kann etwa bei der Frage, wie viel Geld ein Haushalt am Ende des Monats investiert oder anspart gegeben sein, da viele Menschen gar nichts oder sehr wenig zurücklegen und einige sehr viel. Der Mittelwert wäre in dem Szenario unbrauchbar, die Standardabweichung wäre hoch. Konkret ließe sich hier veranlassen, dass diese Befragung beispielsweise im Zusammenhang mit dem Einkommen oder dem Familienstand statistisch neu interpretiert wird.
Die Standardabweichung ist also ein Instrument, um die durchschnittliche Streuung vom Mittelwert bei einer gegebenen Probe zu ermitteln. Eine geringe Standardabweichung deutet auf Homogenität innerhalb der erhobenen Daten hin, während eine hohe Standardabweichung, die nicht durch das Eliminieren von starken Ausreißern behoben werden kann, auf große Unterschiede hinweist. Im oberen Beispiel ließe sich beispielsweise feststellen, dass ein akzeptierter Preis für das Produkt tendenziell im Bereich 13,7 ± 3,29 läge.
Zusammenfassung
- Die Standardabweichung ist ein nützlicher Kennwert bei Statistiken und deren Auswertung
- Die Berechnung erfolgt, indem die Wurzel der Varianz gezogen wird
- Die Varianz lässt sich für Stichproben und die Gesamtheit aller Werte berechnen
- Die Standardabweichung gibt durch ihre relative Größe zur Skala Auskunft darüber, wie homogen ein Datensatz ist
- Je nachdem, welche Daten erhoben werden, lassen sich so Mittelwerte (mit Abweichung nach oben und unten) und letzten Endes auch in Zukunft erwartbare Ergebnisse darstellen
- Wenn eine Normalverteilung vorliegt, liegen ungefähr 68 Prozent aller Datenpunkte in einem Bereich, der dem Mittelwert zuzüglich beziehungsweise abzüglich der Standardabweichung entspricht.