Zum Inhalt springen

Varianz

Die Varianz ist ein Maß für die Streuung von Datenpunkten um ihren Mittelwert. Sie quantifiziert, wie stark die Werte einer Datenmenge variieren, und bildet eine Grundlage für viele statistische Analysen. Die Berechnung unterscheidet sich zwischen der Gesamtheit und einer Stichprobe, wobei die Varianz in quadrierten Einheiten angegeben wird.

Die Varianz (v)( v ) beschreibt die durchschnittliche quadratische Abweichung der Datenpunkte vom Mittelwert. Dabei bezeichnet (n)( n ) die Anzahl der Datenpunkte, (xi)( x_i ) die einzelnen Datenwerte und (xˉ)( \bar{x} ) den Mittelwert der Daten.

Für eine vollständige Gesamtheit wird die Varianz wie folgt berechnet:

v=1ni=1n(xixˉ)2v = \dfrac{1}{n} \sum^{n}_{i=1}(x_i - \bar{x})^2

Bei einer Stichprobe aus der Gesamtheit erfolgt die Berechnung mit (n1)( n-1 ) im Nenner, um eine unverzerrte Schätzung zu gewährleisten:

v=1n1i=1n(xixˉ)2v = \dfrac{1}{n-1} \sum^{n}_{i=1} (x_i - \bar{x})^2
  • Mathematische Grundlage: Die Varianz stellt eine fundamentale Kennzahl in der Statistik dar, die auf den Differenzen zwischen den Datenpunkten und dem Mittelwert beruht.
  • Empfindlichkeit gegenüber Ausreißern: Sie berücksichtigt alle Datenpunkte und ist daher empfindlich gegenüber Ausreißern, was in bestimmten Analysen von Nutzen sein kann.
  • Basis für weitere Analysen: Die Varianz bildet die Grundlage für zahlreiche statistische Tests und Modelle, einschließlich der Standardabweichung und der Normalverteilung.
  • Schwierige Interpretation: Die Varianz lässt sich nicht immer leicht deuten, da sie in quadrierten Einheiten vorliegt.
  • Einheitlichkeit: Die Varianz weist eine andere Einheit auf als die ursprünglichen Daten (beispielsweise das Quadrat der Einheit), was die Interpretation erschwert.
  • Empfindlichkeit gegenüber Ausreißern: Obwohl dies ein Vorteil sein kann, wirkt es sich auch nachteilig aus, da Ausreißer die Varianz stark beeinflussen und zu verzerrten Ergebnissen führen können.
  • Nicht robust: Die Varianz ist nicht robust gegenüber nicht-normalverteilten Daten, was zu ungenauen Schätzungen führen kann.
MerkmalVarianz ((v)( v ))Standardabweichung ((σ)( \sigma ) oder (s)( s ))
DefinitionDurchschnitt der quadrierten AbweichungenQuadratwurzel der Varianz
EinheitQuadrat der Einheit der DatenGleiche Einheit wie die Daten
InterpretationGibt die Streuung in quadrierten Einheiten anGibt die Streuung in den gleichen Einheiten wie die Daten an
Empfindlichkeit gegenüber AusreißernEmpfindlich gegenüber AusreißernEmpfindlich gegenüber Ausreißern
VerwendungOft in der Theorie und bei der Berechnung von TestsHäufiger in der Praxis verwendet, da leichter zu interpretieren

Datatab. (2021, November 28). Varianz (Einfach erklärt). Youtube. Retrieved from https://www.youtube.com/watch?v=iPjXpiB6w9E
Duck.ai. (2024, September 16). Anonymisierte AI-Interaktionen. Retrieved from https://duck.ai