La media es el promedio de un conjunto de datos dado. Consideremos el siguiente ejemplo
Estos ocho puntos de datos tienen la media (promedio) de 5:
Donde μ es la media y x1, x2, x3…., xi son elementos.También hay que tener en cuenta que la media se denota a veces por
La varianza es la suma de los cuadrados de las diferencias entre todos los números y las medias.
Desviación para el ejemplo anterior. Primero, calcula las desviaciones de cada punto de datos respecto a la media, y eleva al cuadrado el resultado de cada una:
Varianza = = 4.
Donde μ es la Media, N es el número total de elementos o la frecuencia de la distribución.
La Desviación Estándar es la raíz cuadrada de la varianza. Es una medida del grado en que los datos varían con respecto a la media.
Desviación estándar (para los datos anteriores) = = 2
¿Por qué los matemáticos eligieron un cuadrado y luego la raíz cuadrada para hallar la desviación, por qué no tomar simplemente la diferencia de valores?
Una razón es que la suma de diferencias se convierte en 0 según la definición de media. La suma de las diferencias absolutas podría ser una opción, pero con las diferencias absolutas era difícil demostrar muchos teoremas bonitos.
- Algunos hechos interesantes:
- El valor de la desviación estándar es 0 si todas las entradas de la entrada son iguales.
- Si añadimos (o restamos) un número, digamos 7, a todos los valores del conjunto de entrada, la media aumenta (o disminuye) en 7, pero la desviación estándar no cambia.
- Si multiplicamos todos los valores del conjunto de entrada por un número 7, tanto la media como la desviación estándar se multiplican por 7. Pero si multiplicamos todos los valores de entrada por un número negativo, por ejemplo -7, la media se multiplica por -7, pero la desviación estándar se multiplica por 7.
- La desviación estándar y la varianza son medidas que indican la dispersión de los números. Mientras que la varianza le da una idea aproximada de la dispersión, la desviación estándar es más concreta, dándole distancias exactas de la media.
- La media, la mediana y la moda son la medida de la tendencia central de los datos (ya sea agrupados o no agrupados).
Las siguientes preguntas se han hecho en los exámenes GATE del año anterior
http://quiz.geeksforgeeks.org/gate-gate-cs-2012-question-64/