Diferença entre variância da amostra e variância da população Diferença entre

Anonim

Explicação

Em estatísticas, o termo amostragem refere-se à seleção de uma parte dos dados estatísticos agregados com o objetivo de obter informações relevantes sobre o todo. O agregado ou o conjunto de informações estatísticas sobre um personagem particular de todos os membros abrangidos pela investigação são chamados de "população" ou "universo". (Das, N. G., 2010). A parte selecionada da população que é usada para obter as características da população ou universo é denominada como "amostra". A população é levada a ser feita de unidades individuais ou membros, e algumas das unidades estão incluídas na amostra. O número total de unidades da população é chamado de tamanho da população, e o da amostra é chamado de tamanho da amostra. População e amostra podem ser finitos ou infinitos e, de forma semelhante, podem ser existentes ou hipotéticos.

Variância: A diferença é um valor numérico que mostra quão amplamente as figuras individuais em um conjunto de dados se distribuem sobre a média. É assim que cada número é da média e, portanto, um do outro. Uma variância do valor zero significa que todos os dados são idênticos. Mais a variância, mais são os valores espalhados sobre a média, portanto, um do outro. Menos a variância, menos são os valores espalhados sobre a média, portanto, um do outro, e a variância não pode ser negativa.

Diferença entre variância populacional e variância da amostra

A principal diferença entre variância populacional e variância da amostra refere-se ao cálculo da variância. A diferença é calculada em cinco etapas. O primeiro meio é calculado, então calculamos os desvios da média e, em terceiro lugar, os desvios são quadrados, em quarto lugar os desvios quadrados são resumidos e, finalmente, essa soma é dividida pelo número de itens para os quais a variância está sendo calculada. Assim variância = Σ (xi-x -) / n. Onde xi = ith. Número, x- = média e n = número de itens …

Agora, quando a variância deve ser calculada a partir dos dados da população, n é igual ao número de itens. Assim, se a variação na pressão sanguínea de todas as 1000 pessoas deve ser calculada a partir de dados sobre as pressões sangüíneas de todas as 1000 pessoas, então n = 1000. No entanto, quando a variância é calculada a partir da amostra, os dados 1 devem ser deduzidos de n antes de dividir o soma dos desvios quadrados. Assim, no exemplo acima, se os dados de amostra tiverem 100 itens, o denominador seria 100 - 1 = 99.

Devido a isso, o valor da variância calculado a partir de dados de amostra é maior que o valor que poderia ter sido descoberto usando dados de população. A lógica de fazer isso é compensar nossa falta de informações sobre os dados da população. É impossível descobrir a variância das alturas nos seres humanos, pela nossa absoluta falta de informação sobre alturas de todos os seres humanos vivos, para não falar sobre o futuro.Mesmo que tomemos um exemplo moderado, como dados populacionais em alturas de todos os homens vivos nos EUA, é fisicamente possível, mas o custo e o tempo envolvidos nessa derrotaria o propósito de seu cálculo. Esta é a razão pela qual os dados da amostra são obtidos para a maioria dos fins estatísticos, e isso é acompanhado de falta de informações sobre a maioria dos dados. Para compensar isso, o valor de variância e desvio padrão, que é a raiz quadrática da variância, são maiores no caso de dados de amostra do que a variação de dados de população.

Isso funciona como um escudo automático para os analistas e tomadores de decisão. A lógica aplica-se para decisões sobre orçamentos de capital, finanças pessoais e empresariais, construção, gerenciamento de tráfego e muitos campos aplicáveis. Isso ajuda o detentor da participação a estar no lado seguro ao tomar uma decisão ou por outras inferências.

Resumo: A variância da população refere-se ao valor da variância que é calculado a partir dos dados da população e a variância da amostra é a variância calculada a partir dos dados da amostra. Devido a este valor de denominador na fórmula de variação no caso de dados de amostra é 'n-1', e é 'n' para dados populacionais. Como resultado, tanto a desvio padrão quanto o desvio padrão derivado dos dados da amostra são mais do que os encontrados a partir dos dados da população.