4. Arithmetisches Mittel und Standardabweichung


Eine andere Assoziation zum Begriff Statistik, die einem sofort in den Sinn kommt, ist der Mittelwert - der Durchschnittswert. So spricht man oft vom mittleren Einkommen, von der durchschnittlichen Zuschauerzahl, vom durchschnittlichen Benzinverbrauch oder etwa vom Durchschnittsalter. Was ein Mittelwert eigentlich ist, welche Aussagekraft er hat, kommt in folgendem Gedicht von P. H. List treffend zum Ausdruck:

  • Ein Mensch, der von Statistik hört,
  • denkt dabei nur am Mittelwert.
  • Er glaubt nicht dran und ist dagegen,
  • ein Beispiel soll es gleich belegen;

  • Ein Jäger auf der Entenjagd,
  • hat einen Schuss erst gewagt.
  • Der Schuss, zu hastig aus dem Rohr,
  • lag eine gute Handbreit vor.

  • Der zweite Schuss mit lautem Krach,
  • lag eine gute Handbreit nach.
  • Der Jäger spricht ganz unbeschwert,
  • voll Glaube an den Mittelwert:
  • Statistisch ist die Ente tot.

  • Doch wär’ er klug und nähme Schrot,
  • - dies sei gesagt, ihn zu bekehren -
  • Er würde seine Chancen mehren:
  • Der Schuss geht ab, die Ente stürzt,
  • weil Streuung ihr das Leben kürzt.

Wie dem Jäger in diesem Gedicht geht es vielen: Man sagt Mittelwert und interpretiert diese Kenngröße als den wahren, den wirklichen Wert.

Beispiel:
Die mittlere Lebensdauer neuer Digitalfernseher wird auf 11 Jahre beziffert. Trotzdem kann es passieren, dass der neue gekaufte Digitalfernseher schon nach wenigen Tagen den Geist aufgibt!

Durch die Angabe von statistischen Kenngrößen hofft man, das Wesentliche oder Typische der Gegebenheit zu erfassen und erhebt nicht, wie oft fälschlich angenommen, den Anspruch auf Gültigkeit im Einzelfall!


Beschreibung von Daten durch:
  • Lagemaße ("typischer Wert") z.B. MW, Zentralwert, Quantile
  • Streuungsmaße ("Abweichungen") z.B. SD, Varianz

Bsp.: Lagemaß bei 50
  • Streuungsmaße bei ca. 35 - 65

aber: wenig sinnvoll bei mehrgipfligen Histogrammen

Beispiel: Lebenserwartung

4.1. Arithmetisches Mittel (Mittelwert)




Beispiel: 9, 1, 2, 2, 0


Hinweis:
  • Mittelwert der Liste der Standardeinheiten = 0
  • SD dieser Liste = 1

Definitionen
Querschnittstudie: Vergleich mehrerer Personen und Objekte zu einem bestimmten Zeitpunkt.
Längsschnittstudie: Vergleich mehrerer Personen und Objekte über einen bestimmten Zeitraum.

Interpretation und Eigenschaften des Mittelwertes:
balanciert das Histogramm aus
ist der "Schwerpunkt" der Verteilung
hängt stark von extremen Werten ab (Hebelwirkung)
ist ungeeignet für stark "schiefe" Verteilungen

4.2. Median

= Zentralwert des Histogramms

Es liegen jeweils 50 % der Werte links und rechts des Medians.


unempfindlich gegenüber extremen Werten
Bsp.: 1, 2, 2, 3
1, 2, 2, 7
in beiden Fällen ist der Median zwei.

4.3. Modus

Lage des "Gipfels" eines Histogramms: häufigster Wert
Im vorherigen Beispiel ist der Modus immer zwei.

4.4. Standardabweichung (SD)
"root mean square" (r.m.s.) einer Liste


1. Zahlen quadrieren
2. Durchschnitt bilden
3. Wurzeln ziehen

Definition der Standardabweichung:

Beispiel

Eigenschaften der Standardabweichung:
  • hat die selbe Einheit wie die Daten (kg, Euro ...)
  • misst die Streuung der Daten um das Mittel
  • Meistens (nicht immer!) liegen 68% der Datenwerte nicht weiter als 1 SD und 95% der Datenwerte nciht weiter als 2 SD vom arithmetischen Mittel entfernt!

Aufgabe 9 aus der Übung:


Transformation einer Liste in eine zweite durch
(A) Addition des gleichen Wertes a zu jedem Wert der Liste,
(B) Multiplikation jedes Wertes der Liste mit dem Wert c,
oder eine Kombination von (A) und (B)
heißt "affin lineare Transformation" oder Skalenwechsel.


allgemein formuliert:
ursprüngliche Liste:
X1, ..., Xn
Mittel: m
SD: s
(A) Addition von a:
X1 + a, ..., Xn + a
Mittel: m + a
SD: s
(B) Multiplikation mit c:
c*X1, ..., c*Xn
Mittel:c*m
SD:|c|*s