Definition: Standardabweichung

Die Standardabweichung ist eine Kennzahl, die den Umfang der Streuung einzelner erhobener Datenpunkte um das arithmetische Mittel aller (oder bei Stichprobenbetrachtung: einiger) Datenpunkte beschreibt. Sie ist die Wurzel der Varianz. Die Standardabweichung kann zur Interpretation von Datenpunkten dienen und gibt unter anderem Aufschluss darüber, wie homogen beispielsweise Antworten innerhalb einer befragten Gruppe sind. Eine bezogen auf die Spanne an möglichen Datenpunkten kleine Abweichung ist tendenziell ein Zeichen für Homogenität, während größere Werte für viele Ausreißer oder eben wenig Homogenität sprechen.

Die Standardabweichung ist ein ganz grundsätzliches Merkmal von statistischen Auswertungen und wird bei Zufallsvariablen mit „σ“ und bei Stichprobenbetrachtungen mit „s“ angegeben.

Wie die Standardabweichung berechnet wird

Es gibt zwei Formeln zur Berechnung der Standardabweichung, die sich nur geringfügig unterscheiden und davon abhängig sind, ob eine Stichprobe (mehrere Datenpunkte aus einer Grundgesamtheit) oder die Grundgesamtheit betrachtet wird.

Hierfür muss zuerst die Varianz berechnet werden. Die Varianz ist das Quadrat der Differenz zwischen dem Datenpunkt und dem arithmetischen Mittelwert der Stichprobe oder der gesamten Datenpunkte. Es werden alle Quadrate (für jeden Datenpunkt also eines) miteinander addiert.

Anschließend wird der so gewonnene Wert durch n – 1 (bei einer Stichprobenbetrachtung) oder durch N (bei der Betrachtung der Grundgesamtheit) geteilt. Nun liegt die Varianz vor. Die Wurzel der Varianz ist die Standardabweichung.

Konkretes Beispiel zur Berechnung der Standardabweichung bei Betrachtung aller Datenpunkte

Gegeben sei eine Frage bezüglich des maximalen Preises in runden Beträgen, den eine Zielgruppe für ein Produkt zu zahlen bereit wäre. Es wurden zehn Personen befragt. Die angegebenen Werte lauteten:

15; 17; 9; 12; 12; 18; 14; 19; 11; 10

Zuerst wird der Mittelwert gebildet:

(15 + 17 + 9 + 12 + 12 + 18 + 14 + 19 + 11 + 10) / 10 = 13,7

Die Varianz wird berechnet, indem die Differenz aus Wert und Mittelwert zum Quadrat genommen wird. Hier werden dann die zehn gewonnenen Werte addiert. Dies heißt:

(15 – 13,7)² + (17 – 13,7)² + (9 – 13,7)² + (12 – 13,7)² + (12 – 13,7)² + (18 – 13,7)² + (14 – 13,7)² + (19 – 13,7)² + (11 – 13,7)² + (10 – 13,7)² = 1,69 + 10,89 + 22,09 + 2,89 + 2,89 + 18,49 + 0,09 + 28,09 + 7,29 + 13,69 = 108,1.

Nun wird die Summe durch n – 1 oder N geteilt. Hier wird eine (kleine) Gesamtheit betrachtet, deshalb wird N verwendet. Die Varianz ist:

108,1 / N = 108,1 /10 = 10,81.

Die Wurzel ist die Standardabweichung, also √10,81 = 3,29. Hiermit ist die Standardabweichung für diese Statistik berechnet.

Handelte es sich hingegen um eine Stichprobe, lautet die Berechnung: 108,1 / n – 1 = 108,1 / 9 = 12,01. Die Wurzel ist 3,47 und damit ist die Standardabweichung 3,47.

Der Mittelwert und die Standardabweichung werden als kursives M und kursives SD angegeben. In oberen Falle entspräche dies: M (SD): 13,7 (3,29).

Interpretation der Standardabweichung

Die Standardabweichung macht zunächst die Varianz zu einer sinnvollen Kennzahl. Da die Varianz einzelner Datenpunkte bezogen auf den Mittelwert stark schwanken kann und sie zudem als Quadratzahl vorliegt, ist sie nur bedingt ins Verhältnis zu setzen. Im oberen Beispiel entspräche dies 10,81 bei einer Skala von 9 bis 19 (kleinster und größter Antwortwert). Dies sagt nichts viel aus. Beim Betrachten der Standardabweichung lassen sich hingegen einige Schlüsse ziehen.

Bei der Skala von 9 bis 19 (insgesamt 11 Punkte) lässt sich etwa sagen, dass eine Standardabweichung von 3,29 nicht besonders hoch ist. Sollte die Erhebung zudem der Normalverteilung folgen, lässt sich auch annehmen, dass circa 68 Prozent aller Datenpunkte in diesen Bereich (Wert ≦ 13,7 ± 3,29) fallen. Dies wäre gegebenenfalls zu prüfen, da die Anzahl erhobener Datenpunkte recht klein und nur des Beispiels wegen so gewählt war.

Bei einer hohen Standardabweichung ist es hingegen so, dass wahrscheinlich keine Normalverteilung vorliegt. Dies kann etwa bei der Frage, wie viel Geld ein Haushalt am Ende des Monats investiert oder anspart gegeben sein, da viele Menschen gar nichts oder sehr wenig zurücklegen und einige sehr viel. Der Mittelwert wäre in dem Szenario unbrauchbar, die Standardabweichung wäre hoch. Konkret ließe sich hier veranlassen, dass diese Befragung beispielsweise im Zusammenhang mit dem Einkommen oder dem Familienstand statistisch neu interpretiert wird.

Die Standardabweichung ist also ein Instrument, um die durchschnittliche Streuung vom Mittelwert bei einer gegebenen Probe zu ermitteln. Eine geringe Standardabweichung deutet auf Homogenität innerhalb der erhobenen Daten hin, während eine hohe Standardabweichung, die nicht durch das Eliminieren von starken Ausreißern behoben werden kann, auf große Unterschiede hinweist. Im oberen Beispiel ließe sich beispielsweise feststellen, dass ein akzeptierter Preis für das Produkt tendenziell im Bereich 13,7 ± 3,29 läge.

Zusammenfassung

  • Die Standardabweichung ist ein nützlicher Kennwert bei Statistiken und deren Auswertung
  • Die Berechnung erfolgt, indem die Wurzel der Varianz gezogen wird
  • Die Varianz lässt sich für Stichproben und die Gesamtheit aller Werte berechnen
  • Die Standardabweichung gibt durch ihre relative Größe zur Skala Auskunft darüber, wie homogen ein Datensatz ist
  • Je nachdem, welche Daten erhoben werden, lassen sich so Mittelwerte (mit Abweichung nach oben und unten) und letzten Endes auch in Zukunft erwartbare Ergebnisse darstellen
  • Wenn eine Normalverteilung vorliegt, liegen ungefähr 68 Prozent aller Datenpunkte in einem Bereich, der dem Mittelwert zuzüglich beziehungsweise abzüglich der Standardabweichung entspricht.