Der Mittelwert ist der Durchschnitt einer gegebenen Menge von Daten. Betrachten wir folgendes Beispiel
Diese acht Datenpunkte haben den Mittelwert (Durchschnitt) von 5:
Wobei μ der Mittelwert ist und x1, x2, x3…., xi Elemente sind.Beachten Sie auch, dass der Mittelwert manchmal mit
Die Varianz ist die Summe der Quadrate der Differenzen zwischen allen Zahlen und dem Mittelwert.
Abweichung für obiges Beispiel. Berechnen Sie zunächst die Abweichungen jedes Datenpunktes vom Mittelwert und quadrieren Sie das Ergebnis jeweils:
Varianz = = 4.
Wobei μ der Mittelwert, N die Gesamtzahl der Elemente oder die Häufigkeit der Verteilung ist.
Die Standardabweichung ist die Quadratwurzel der Varianz. Sie ist ein Maß für das Ausmaß, in dem Daten vom Mittelwert abweichen.
Standardabweichung (für obige Daten) = = 2
Warum haben die Mathematiker ein Quadrat und dann die Quadratwurzel gewählt, um die Abweichung zu finden, warum nicht einfach die Differenz der Werte nehmen?
Ein Grund ist, dass die Summe der Differenzen nach der Definition des Mittelwertes 0 wird. Die Summe der absoluten Differenzen könnte eine Option sein, aber mit absoluten Differenzen war es schwierig, viele schöne Theoreme zu beweisen.
- Ein paar interessante Fakten:
- Der Wert der Standardabweichung ist 0, wenn alle Einträge in der Eingabe gleich sind.
- Wenn wir eine Zahl, sagen wir 7, zu allen Werten in der Eingabemenge addieren (oder subtrahieren), wird der Mittelwert um 7 erhöht (oder verringert), aber die Standardabweichung ändert sich nicht.
- Wenn wir alle Werte in der Eingabemenge mit einer Zahl 7 multiplizieren, wird sowohl der Mittelwert als auch die Standardabweichung mit 7 multipliziert. Wenn wir jedoch alle Eingabewerte mit einer negativen Zahl, z. B. -7, multiplizieren, wird der Mittelwert mit -7 multipliziert, aber die Standardabweichung wird mit 7 multipliziert.
- Standardabweichung und Varianz sind ein Maß, das angibt, wie weit die Zahlen auseinander liegen. Während die Varianz Ihnen eine grobe Vorstellung von der Streuung gibt, ist die Standardabweichung konkreter und gibt Ihnen genaue Abstände vom Mittelwert an.
- Mittelwert, Median und Modus sind das Maß für die zentrale Tendenz von Daten (entweder gruppiert oder nicht gruppiert).
Die folgenden Fragen wurden in den GATE-Prüfungen des Vorjahres gestellt
http://quiz.geeksforgeeks.org/gate-gate-cs-2012-question-64/