p>As medidas de tendência central ajudam a encontrar o meio, ou a média, de um conjunto de dados. As 3 medidas mais comuns de tendência central são a moda, mediana e média.
- Mode: o valor mais frequente.
- Mediana: o número médio num conjunto de dados ordenado.
- Média: a soma de todos os valores dividida pelo número total de valores.
Além da tendência central, a variabilidade e distribuição do seu conjunto de dados é importante de compreender ao executar a estatística descritiva.
Distribuições e tendência central
Um conjunto de dados é uma distribuição de n número de pontuações ou valores.
Distribuição normal
Numa distribuição normal, os dados são distribuídos simetricamente sem enviesamento. A maioria dos valores agrupa-se em torno de uma região central, com valores a afunilar à medida que se afastam mais do centro. A média, modo e mediana são exactamente os mesmos numa distribuição normal.
Distribuições enviesadas
Em distribuições enviesadas, caem mais valores de um lado do centro do que do outro, e a média, a mediana e a moda diferem todas umas das outras. Um lado tem uma cauda mais espalhada e mais longa, com menos pontuações numa extremidade do que na outra. A direcção desta cauda diz-lhe o lado do enviesado
Numa distribuição positivamente enviesada, há um aglomerado de pontuações mais baixas e uma cauda estendida à direita. Numa distribuição enviesada negativamente, há um aglomerado de pontuações mais altas e uma cauda estendida à esquerda.
- Distribuição enviesada positiva
- Negativamente distribuição enviesada
Modo
O modo é o valor mais frequente no conjunto de dados. É possível não ter nenhum modo, um modo, ou mais de um modo.
Para encontrar o modo, classifique o seu conjunto de dados numérica ou categoricamente e seleccione a resposta que ocorre mais frequentemente.
Para encontrar o modo, classifique os seus dados por categoria e descubra qual a resposta escolhida com mais frequência.
Para facilitar, pode criar uma tabela de frequência para contar os valores para cada categoria.
Political ideology | Frequency |
---|---|
>Conservador | 2 |
Moderate | 3 |
4 |
Mode: Liberal
O modo é facilmente visível num gráfico de barras porque é o valor com a barra mais alta.
Quando se usa o modo
O modo é mais aplicável a dados de um nível nominal de medição. Os dados nominais são classificados em categorias mutuamente exclusivas, por isso o modo diz-lhe a categoria mais popular.
Para variáveis contínuas ou níveis de proporção de medida, o modo pode não ser uma medida útil de tendência central. Isto porque há muito mais valores possíveis do que num nível de medida nominal ou ordinal. É improvável que um valor se repita num nível de razão de medição.
Participante | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|
Tempo de reacção (milissegundos) | 267 | 345 | 421 | 324 | 401 | 312 | 382 | 298 | 303 |
Neste conjunto de dados, não há modo, porque cada valor ocorre apenas uma vez.
Median
A mediana de um conjunto de dados é o valor que se encontra exactamente no meio quando é ordenado de baixo para alto.
Participante | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|
>Velocidade | Medium | Slow | Fast | Fast | Medium | Fast | Slow |
Para encontrar a mediana, encomendar primeiro todos os valores de baixo para alto. Depois, encontra o valor no meio do conjunto de dados encomendado – neste caso, o valor na 4ª posição.
Conjunto de dados encomendados | Slow | Slow | Medium | Medium | Fast | Fast | Fast |
---|
Median: Medium
Em conjuntos de dados maiores, é mais fácil usar fórmulas simples para descobrir a posição do valor médio na distribuição. Utilizam-se métodos diferentes para encontrar a mediana de um conjunto de dados, dependendo se o número total de valores é par ou ímpar.
Mediana de um conjunto de dados ímpar
Para um conjunto de dados ímpar, encontrar o valor que se encontra na posição (n+1)/2, onde n é o número de valores no conjunto de dados.
Tempo de reacção (milissegundos) | 287 | 298 | 345 | 365 | 380 |
---|
A posição intermédia é calculada usando (n+1)/2, onde n = 5.
(5+1)/2 = 3
Isso significa que a mediana é o 3º valor no seu conjunto de dados encomendados.
Median: 345 milissegundos
Mediana de um conjunto de dados de número par
Para um conjunto de dados de número par, encontre os dois valores no meio do conjunto de dados: os valores nas posições n/2 e (n/2) + 1. Depois, encontrar a sua média.
287 | 298 | 357 | 365 | 380 |
As posições centrais são calculadas usando n/2 e (n/2) + 1, onde n = 6.
6/2 = 3
(6/2) + 1 = 4
Isso significa que os valores médios são o 3º valor, que é 345, e o 4º valor, que é 357.
Para obter a mediana, tomar a média dos 2 valores médios somando-os juntos e dividindo por dois.
(345 + 357)/2 = 351
Median: 351 milissegundos
Mean
A média aritmética de um conjunto de dados é a soma de todos os valores dividida pelo número total de valores. É a medida de tendência central mais utilizada porque todos os valores são utilizados no cálculo.
Participante | 1 | 2 | 3 | 4 | 5 | |
---|---|---|---|---|---|---|
Reacção tempo (milissegundos) | 287 | 345 | 365 | 298 | 380 |
P>Primeiro somar a soma de todos os valores:
⅀x = 287 + 345 + 365 + 298 + 380 = 1675
Então calcula a média utilizando a fórmula ⅀x/n. Existem 5 valores no conjunto de dados, portanto n = 5.
Mean (x̄) = 1675/5 = 335
Mean: 335 milissegundos
Efeito anterior sobre a média
Outliers podem aumentar ou diminuir significativamente a média quando são incluídos no cálculo. Uma vez que todos os valores são utilizados para calcular a média, esta pode ser afectada por outliers extremos. Um outlier é um valor que difere significativamente dos outros num conjunto de dados.
Participant | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
832 | 345 | 365 | 298 | 380 |
⅀x = 832 + 345 + 365 + 298 + 380 = 2220
Mean (x̄) = ⅀x/n = 2220/5 = 444
Due to the outlier, a média torna-se muito mais elevada, mesmo que todos os outros números do conjunto de dados permaneçam os mesmos.
Mean: 444 milisegundos
População versus média da amostra
Um conjunto de dados contém valores de uma amostra ou de uma população. Uma população é todo o grupo que está interessado em pesquisar, enquanto uma amostra é apenas um subconjunto dessa população.
Enquanto os dados de uma amostra podem ajudá-lo a fazer estimativas sobre uma população, apenas os dados populacionais completos podem dar-lhe o quadro completo.
Nas estatísticas, a notação de uma média de amostra e de uma média de população e as suas fórmulas são diferentes. Mas os procedimentos para calcular a população e a média da amostra são os mesmos.
- Fórmula da média da amostra
- Fórmula da média da população
A média da amostra é escrita como M ou x̄ (pronuncia-se x-bar). Para calcular a média de uma amostra, utilizar esta fórmula:
A média da população é escrita como μ (termo grego mu). Para calcular a média de uma população, usar esta fórmula:
Quando se deve usar a média, mediana ou modo?
As 3 medidas principais de tendência central são melhor utilizadas em combinação umas com as outras porque têm forças e limitações complementares. Mas por vezes apenas 1 ou 2 delas são aplicáveis ao seu conjunto de dados, dependendo do nível de medida da variável.
- O modo pode ser usado para qualquer nível de medida, mas é mais significativo para os níveis nominal e ordinal.
- A mediana só pode ser usada em dados que podem ser ordenados – isto é, a partir de níveis de medição ordinais, de intervalo e de relação.
- A média só pode ser usada em níveis de medição de intervalo e de relação, porque requer o mesmo espaçamento entre valores ou pontuações adjacentes na escala.
Níveis de medição | Exemplos | Medida de tendência central |
---|---|---|
Nominal |
|
>ul>>li>Modo/ul> |
Ordinal | >ul>
|
|
Intervalo e proporção | >ul>
|
ul>
/td> |
Decidir quais as medidas de tendência central a utilizar, deve também considerar a distribuição do seu conjunto de dados.
Para dados normalmente distribuídos, as três medidas de tendência central dar-lhe-ão a mesma resposta para que possam ser todas utilizadas.
Em distribuições enviesadas, a mediana é a melhor medida porque não é afectada por distribuições extremas ou não simétricas de pontuações. A média e o modo podem variar em distribuições enviesadas.
Perguntas frequentes sobre a tendência central
As medidas de tendência central ajudam a encontrar o meio, ou a média, de um conjunto de dados.
As 3 medidas mais comuns de tendência central são a média, a mediana e a moda.
- O modo é o valor mais frequente.
- A mediana é o número médio de um conjunto de dados ordenado.
- A média é a soma de todos os valores dividida pelo número total de valores.
As medidas de tendência central que pode utilizar depende do nível de medida dos seus dados.
- Para um nível nominal, só pode utilizar o modo para encontrar o valor mais frequente.
- Para um nível ordinal ou dados classificados, também pode utilizar a mediana para encontrar o valor no meio do seu conjunto de dados.
- Para níveis de intervalo ou proporção, além do modo e da mediana, pode usar a média para encontrar o valor médio.
A média é a medida de tendência central mais frequentemente utilizada porque utiliza todos os valores do conjunto de dados para lhe dar uma média.
Para dados de distribuições distorcidas, a mediana é melhor do que a média porque não é influenciada por valores extremamente grandes.
O modo é a única medida que pode utilizar para dados nominais ou categóricos que não podem ser ordenados.