Diferença entre população e amostra desvio padrão

Anonim

População versus amostra de desvio padrão

Nas estatísticas, vários índices são usados ​​para descrever um conjunto de dados correspondente a sua tendência central, sua dispersão e sua disparidade. O desvio padrão é uma das medidas mais comuns de dispersão de dados do centro do conjunto de dados.

Devido a dificuldades práticas, não será possível utilizar dados de toda a população quando uma hipótese for testada. Portanto, empregamos valores de dados de amostras para fazer inferências sobre a população. Em tal situação, estes são chamados estimadores, uma vez que estimam os valores dos parâmetros da população.

É extremamente importante usar estimadores imparciais na inferência. Um estimador é dito ser imparcial se o valor esperado desse estimador for igual ao parâmetro da população. Por exemplo, usamos a média da amostra como um estimador imparcial para a média da população. (Matematicamente, pode-se mostrar que o valor esperado da média da amostra é igual à média da população). No caso de estimar o desvio padrão da população, o desvio padrão da amostra também é um estimador imparcial.

O que é o desvio padrão da população?

Quando os dados de toda a população podem ser incluídos na conta (por exemplo, no caso de um censo), é possível calcular o desvio padrão da população. Para calcular o desvio padrão da população, primeiro os desvios dos valores de dados da média da população são calculados. O quadrado médio da raiz (média quadrática) dos desvios é chamado de desvio padrão da população.

Em uma turma de 10 alunos, os dados sobre os alunos podem ser facilmente coletados. Se uma hipótese for testada nessa população de alunos, não há necessidade de usar valores de amostra. Por exemplo, os pesos dos 10 alunos (em quilogramas) são medidos para ser 70, 62, 65, 72, 80, 70, 63, 72, 77 e 79. Em seguida, o peso médio das dez pessoas (em quilogramas) é (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, que é 71 (em quilogramas). Esta é a média da população.

Agora, para calcular o desvio padrão da população, calculamos desvios da média. Os respectivos desvios da média são (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 e (79 - 71) = 8. A soma dos quadrados de desvio é (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 < + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. O desvio padrão da população é √ (366/10) = 6,05 (em quilogramas). 71 é o peso médio exato dos estudantes da classe e 6.05 é o desvio padrão padrão do peso de 71. O que é o desvio padrão da amostra?

Quando os dados de uma amostra (de tamanho n) são usados ​​para estimar parâmetros da população, o desvio padrão da amostra é calculado. Primeiro, os desvios dos valores de dados da média da amostra são calculados. Uma vez que a média da amostra é utilizada no lugar da média da população (o que é desconhecido), tomar o meio quadrático não é apropriado. Para compensar o uso da média da amostra, a soma dos quadrados dos desvios é dividida por (n-1) em vez de n. O desvio padrão da amostra é a raiz quadrada deste. Em símbolos matemáticos, S = √ {Σ (x

i -ẍ) 2 / (n-1)}, onde S é o desvio padrão da amostra, ẍ é a média da amostra e x i são os pontos de dados. Agora suponha que, no exemplo anterior, a população é a aluna de toda a escola. Então, a classe será apenas uma amostra. Se essa amostra for usada na estimativa, o desvio padrão da amostra será √ (366/9) = 6,38 (em quilogramas), uma vez que 366 foi dividido em 9 em vez de 10 (o tamanho da amostra). O fato de observar é que isso não é garantido para ser o valor exato da desvantagem padrão da população. É apenas uma estimativa para isso.

Qual a diferença entre desvio padrão da população e desvio padrão da amostra?

• O desvio padrão da população é o valor do parâmetro exato usado para medir a dispersão do centro, enquanto o desvio padrão da amostra é um estimador imparcial para isso.

• O desvio padrão da população é calculado quando todos os dados relativos a cada indivíduo da população são conhecidos. De outra forma, o desvio padrão da amostra é calculado.

• O desvio padrão da população é dado por σ = √ {Σ (xi-μ)

2 / n} onde μ é a média da população e n é o tamanho da população, mas o desvio padrão da amostra é dado por S = √ {Σ (xi-ẍ) 2 / (n-1)} onde ẍ é a média da amostra e n é o tamanho da amostra.