Las medidas de tendencia central ayudan a encontrar el medio, o la media, de un conjunto de datos. Las 3 medidas de tendencia central más comunes son la moda, la mediana y la media.
- Moda: el valor más frecuente.
- Media: el número medio en un conjunto de datos ordenados.
- Media: la suma de todos los valores dividida por el número total de valores.
- Distribución sesgada positivamente
- Distribución sesgada negativamente distribución sesgada
- Fórmula de la media muestral
- Fórmula de la media poblacional
- La moda puede utilizarse para cualquier nivel de medición, pero es más significativa para los niveles nominal y ordinal.
- La mediana sólo puede utilizarse en datos que puedan ordenarse -es decir, de los niveles de medición ordinal, de intervalo y de razón.
- La media sólo puede utilizarse en los niveles de medición de intervalo y de razón porque requiere un espacio igual entre los valores o puntuaciones adyacentes en la escala.
- Etnicidad
- Ideología política
- Modo
- Nivel de ansiedad
- Rango de ingresos
- Modo
- Mediana
- Tiempo de reacción
- Puntuación de la prueba
- Temperatura
- Tiempo de reacción
- Tiempo de vida.
- Modo
- Media
- Media
- La moda es el valor más frecuente.
- La mediana es el número medio en un conjunto de datos ordenados.
- La media es la suma de todos los valores dividida por el número total de valores.
- Para un nivel nominal, sólo puede utilizar la moda para encontrar el valor más frecuente.
- Para un nivel ordinal o datos clasificados, también puede utilizar la mediana para encontrar el valor en el medio de su conjunto de datos.
- Para los niveles de intervalo o proporción, además de la moda y la mediana, puede utilizar la media para encontrar el valor medio.
Además de la tendencia central, es importante comprender la variabilidad y la distribución de su conjunto de datos al realizar estadísticas descriptivas.
Distribuciones y tendencia central
Un conjunto de datos es una distribución de n número de puntuaciones o valores.
Distribución normal
En una distribución normal, los datos se distribuyen de forma simétrica y sin sesgo. La mayoría de los valores se agrupan alrededor de una región central, y los valores disminuyen a medida que se alejan del centro. La media, la moda y la mediana son exactamente iguales en una distribución normal.
Distribuciones sesgadas
En las distribuciones sesgadas, hay más valores en un lado del centro que en el otro, y la media, la mediana y la moda difieren entre sí. Un lado tiene una cola más extendida y más larga con menos puntuaciones en un extremo que en el otro. La dirección de esta cola indica el lado de la asimetría
En una distribución sesgada positivamente, hay un grupo de puntuaciones más bajas y una cola extendida a la derecha. En una distribución sesgada negativamente, hay un grupo de puntuaciones más altas y una cola extendida a la izquierda.
Modo
El modo es el valor que aparece con más frecuencia en el conjunto de datos. Es posible no tener ningún modo, un modo o más de un modo.
Para encontrar el modo, ordene su conjunto de datos numérica o categóricamente y seleccione la respuesta que se produce con más frecuencia.
Para encontrar la moda, ordena tus datos por categorías y encuentra qué respuesta se ha elegido con más frecuencia.
Para hacerlo más fácil, puedes crear una tabla de frecuencias para contar los valores de cada categoría.
Ideología política | Frecuencia |
---|---|
Conservador | 2 |
3 | |
Liberal | 4 |
Modo: Liberal
El modo se ve fácilmente en un gráfico de barras porque es el valor con la barra más alta.
Cuándo utilizar la moda
La moda es más aplicable a los datos de un nivel nominal de medición. Los datos nominales se clasifican en categorías mutuamente excluyentes, por lo que la moda le indica la categoría más popular.
Para las variables continuas o los niveles de medición de proporción, la moda puede no ser una medida útil de tendencia central. Esto se debe a que hay muchos más valores posibles que en un nivel de medición nominal u ordinal. Es poco probable que un valor se repita en un nivel de medición de proporción.
Participante | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|
Tiempo de reacción (milisegundos) | 267 | 345 | 421 | 324 | 401 | 312 | 382 | 298 | 303 |
En este conjunto de datos, no hay modo, porque cada valor ocurre sólo una vez.
Mediana
La mediana de un conjunto de datos es el valor que está exactamente en el medio cuando se ordena de menor a mayor.
Participante | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|
Velocidad | Medio | Lento | Rápido | Medio | Rápido | Lento | |
Para encontrar la mediana, primero se ordenan todos los valores de menor a mayor. Luego, encuentras el valor en el medio del conjunto de datos ordenados, en este caso, el valor en la 4ª posición.
Conjunto de datos ordenados | Lento | Lento | Medio | Medio | Rápido | Rápido | Rápido |
---|
Media: Media
En conjuntos de datos más grandes, es más fácil utilizar fórmulas simples para averiguar la posición del valor medio en la distribución. Se utilizan diferentes métodos para encontrar la mediana de un conjunto de datos dependiendo de si el número total de valores es par o impar.
Mediana de un conjunto de datos impares
Para un conjunto de datos impares, encuentre el valor que se encuentra en la posición (n+1)/2, donde n es el número de valores en el conjunto de datos.
Tiempo de reacción (milisegundos) | 287 | 298 | 345 | 365 | 380 |
---|
La posición media se calcula utilizando (n+1)/2, donde n = 5.
(5+1)/2 = 3
Eso significa que la mediana es el 3er valor en su conjunto de datos ordenados.
Mediana: 345 milisegundos
Mediana de un conjunto de datos par
Para un conjunto de datos par, encuentra los dos valores en el medio del conjunto de datos: los valores en las posiciones n/2 y (n/2) + 1. Luego encuentra su media.
Luego, encuentra su media.
Tiempo de reacción (milisegundos) | 287 | 298 | 345 | 357 | 365 | 380 |
---|
Las posiciones intermedias se calculan utilizando n/2 y (n/2) + 1, donde n = 6.
(6/2) + 1 = 4
Esto significa que los valores medios son el 3º valor, que es 345, y el 4º valor, que es 357.
Para obtener la mediana, toma la media de los 2 valores medios sumándolos y dividiendo por dos.
(345 + 357)/2 = 351
Media: 351 milisegundos
Media
La media aritmética de un conjunto de datos es la suma de todos los valores dividida por el número total de valores. Es la medida de tendencia central más utilizada porque todos los valores se utilizan en el cálculo.
Participante | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
Reacción tiempo (milisegundos) | 287 | 345 | 365 | 298 | 380 |
Primero se suma la suma de todos los valores:
⅀x = 287 + 345 + 365 + 298 + 380 = 1675
Después se calcula la media mediante la fórmula ⅀x/n. Hay 5 valores en el conjunto de datos, por lo que n = 5.
Media (x̄) = 1675/5 = 335
Media: 335 milisegundos
Efecto de los valores atípicos en la media
Los valores atípicos pueden aumentar o disminuir significativamente la media cuando se incluyen en el cálculo. Dado que todos los valores se utilizan para calcular la media, ésta puede verse afectada por valores atípicos extremos. Un valor atípico es un valor que difiere significativamente de los demás en un conjunto de datos.
Participante | 1 | 2 | 3 | 4 | 5 | Tiempo de reacción (milisegundos) | 832 | 345 | 365 | 298 | 380 |
---|
⅀x = 832 + 345 + 365 + 298 + 380 = 2220
Media (x̄) = ⅀x/n = 2220/5 = 444
Debido al valor atípico, la media se vuelve mucho más alta, aunque todos los demás números del conjunto de datos permanecen iguales.
Media: 444 milisegundos
Media de la población frente a la de la muestra
Un conjunto de datos contiene valores de una muestra o de una población. Una población es todo el grupo que te interesa investigar, mientras que una muestra es sólo un subconjunto de esa población.
Aunque los datos de una muestra pueden ayudarte a hacer estimaciones sobre una población, sólo los datos de la población completa pueden darte la imagen completa.
En estadística, la notación de una media muestral y una media poblacional y sus fórmulas son diferentes. Pero los procedimientos para calcular las medias poblacional y muestral son los mismos.
La media muestral se escribe como M o x̄ (se pronuncia x-bar). Para calcular la media de una muestra, utilice esta fórmula:
La media poblacional se escribe como μ (término griego mu). Para calcular la media de una población se utiliza esta fórmula:
¿Cuándo se debe utilizar la media, la mediana o la moda?
Las 3 principales medidas de tendencia central se utilizan mejor en combinación entre sí porque tienen fortalezas y limitaciones complementarias. Pero a veces sólo 1 o 2 de ellas son aplicables a su conjunto de datos, dependiendo del nivel de medición de la variable.
Niveles de medida | Ejemplos | Medida de tendencia central |
---|---|---|
Nominal |
|
|
Ordinal |
|
|
Intervalo y relación |
|
|
Para decidir qué medidas de tendencia central utilizar, también debe considerar la distribución de su conjunto de datos.
Para los datos con distribución normal, las tres medidas de tendencia central le darán la misma respuesta, por lo que pueden utilizarse todas.
En distribuciones sesgadas, la mediana es la mejor medida porque no se ve afectada por los valores extremos o las distribuciones no simétricas de las puntuaciones. La media y la moda pueden variar en distribuciones sesgadas.
Preguntas frecuentes sobre la tendencia central
Las medidas de tendencia central ayudan a encontrar el medio, o la media, de un conjunto de datos.
Las 3 medidas de tendencia central más comunes son la media, la mediana y la moda.
Las medidas de tendencia central que puede utilizar dependen del nivel de medición de sus datos.
La media es la medida de tendencia central más utilizada porque utiliza todos los valores del conjunto de datos para ofrecer una media.
Para los datos de distribuciones sesgadas, la mediana es mejor que la media porque no está influenciada por valores extremadamente grandes.
La moda es la única medida que se puede utilizar para datos nominales o categóricos que no se pueden ordenar.