Diferença entre tendência central e dispersão

Anonim

Tendência Central versus Dispersão

Central

Na estatística descritiva e inferencial, vários índices são usados ​​para descrever um conjunto de dados correspondente à sua central tendência, dispersão e skewness: as três propriedades mais importantes que determinam a forma relativa da distribuição de um conjunto de dados.

Qual é a tendência central?

A tendência central refere-se e localiza o centro da distribuição de valores. O modo médio, o modo e a mediana são os índices mais utilizados para descrever a tendência central de um conjunto de dados. Se um conjunto de dados é simétrico, tanto a mediana como a média do conjunto de dados coincidem umas com as outras.

Dado um conjunto de dados, a média é calculada tomando a soma de todos os valores de dados e depois dividindo-o pelo número de dados. Por exemplo, os pesos de 10 pessoas (em quilogramas) são medidos para ser 70, 62, 65, 72, 80, 70, 63, 72, 77 e 79. Em seguida, o peso médio das dez pessoas (em quilogramas) pode ser calculado da seguinte forma. A soma dos pesos é 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Média = (soma) / (número de dados) = 710/10 = 71 (em quilogramas). Entende-se que outliers (pontos de dados que se desviam da tendência normal) tendem a afetar a média. Assim, na presença de outliers, o significado único não dará uma imagem correta sobre o centro do conjunto de dados.

A mediana é o ponto de dados encontrado no meio exato do conjunto de dados. Uma maneira de calcular a mediana é ordenar os pontos de dados em ordem crescente e, em seguida, localizar o ponto de dados no meio. Por exemplo, se uma vez ordenado o conjunto de dados anteriores, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Portanto, (70 + 72) / 2 = 71 está no meio. A partir disso, é visto que a mediana não precisa estar no conjunto de dados. A mediana não é afetada pela presença de outliers. Portanto, a mediana servirá como uma melhor medida da tendência central na presença de valores anormais.

O modo é o valor mais freqüente no conjunto de dados. No exemplo anterior, os valores 70 e 72 ocorrem duas vezes e, portanto, ambos são modos. Isso mostra que, em algumas distribuições, há mais de um valor modal. Se houver apenas um modo, diz-se que o conjunto de dados é unimodal, neste caso, o conjunto de dados é bimodal.

O que é dispersão?

A dispersão é a quantidade de disseminação de dados sobre o centro da distribuição. O intervalo e o desvio padrão são as medidas de dispersão mais utilizadas.

O intervalo é simplesmente o valor mais alto menos o valor mais baixo. No exemplo anterior, o valor mais alto é 80 eo valor mais baixo é 62, portanto o intervalo é 80-62 = 18. Mas o intervalo não fornece uma imagem suficiente sobre a dispersão. Para calcular o desvio padrão, primeiro os desvios dos valores de dados da média são calculados. A média da raiz dos desvios é chamada de desvio padrão. No exemplo anterior, os respectivos desvios da média são (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 e (79 - 71) = 8. A soma de os quadrados de desvio são (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2

= 366. O desvio padrão é √ (366/10) = 6,05 (em quilogramas). A menos que o conjunto de dados esteja muito distorcido, pode-se concluir que a maioria dos dados está no intervalo 71 ± 6. 05, e é mesmo assim neste exemplo particular.

Qual a diferença entre a tendência central e a dispersão?

• A tendência central refere-se e localiza o centro da distribuição de valores

• A dispersão é a quantidade de disseminação de dados sobre o centro de um conjunto de dados.