Diferença entre variância e covariância: variância versus covariância comparada

Anonim

Variance vs Covariance

A variância e a covariância são duas medidas utilizadas nas estatísticas. A variância é uma medida da dispersão dos dados e a covariância indica o grau de mudança de duas variáveis ​​aleatórias em conjunto. A variância é um conceito bastante intuitivo, mas a covariância é definida matematicamente em não tão intuitiva no início.

Mais sobre Variance

A diferença é uma medida da dispersão dos dados do valor médio da distribuição. Ele conta até que ponto os pontos de dados se situam na média da distribuição. É um dos principais descritores da distribuição de probabilidade e um dos momentos da distribuição. Além disso, a variância é um parâmetro da população, e a variância de uma amostra da população atua como um estimador para a variação da população. De uma perspectiva, é definido como o quadrado do desvio padrão.

Em linguagem simples, pode ser descrito como a média dos quadrados da distância entre cada ponto de dados e a média da distribuição. A fórmula seguinte é usada para calcular a variância.

Var (X) = E [(X-μ) 2 ] para uma população e

Var (X) = E [(X-~x) 2] para uma amostra Pode ainda ser simplificado para dar Var (X) = E [X

2 ] - (E [X]) 2 . A variância possui algumas propriedades de assinatura e muitas vezes usadas em estatísticas para simplificar o uso. A diferença não é negativa porque é o quadrado das distâncias. No entanto, o intervalo da variância não é confinado e depende da distribuição específica. A variância de uma variável aleatória constante é zero e a variância não muda em relação a um parâmetro de localização.

Mais sobre Covariância Na teoria estatística, a covariância é uma medida de quanto duas variáveis ​​aleatórias mudam juntas. Em outras palavras, a covariância é uma medida da força da correlação entre duas variáveis ​​aleatórias. Além disso, pode ser considerado como uma generalização do conceito de variância de duas variáveis ​​aleatórias.

A covariância de duas variáveis ​​aleatórias X e Y, que são distribuídas em conjunto com o segundo impulso finito, é conhecida como σ

XY = E [(X-E [X]) (Y-E [Y])]. A partir disso, a variância pode ser vista como um caso especial de covariância, onde duas variáveis ​​são as mesmas. Cov (X, X) = Var (X) Ao normalizar a covariância, pode-se obter o coeficiente de correlação linear ou o coeficiente de correlação de Pearson, que é definido como ρ = E [(XE [X]) (YE [Y]] / / σ

X σ Y ) = (Cov (X, Y)) / (σ X σ Y ) Graficamente, a covariância entre um par de pontos de dados pode ser vista como a área do retângulo com os pontos de dados nos vértices opostos.Pode ser interpretado como uma medida de magnitude de separação entre os dois pontos de dados. Considerando os retângulos para toda a população, a sobreposição dos retângulos correspondentes a todos os pontos de dados pode ser considerada como a força da separação; variância das duas variáveis. A covariância está em duas dimensões, por causa de duas variáveis, mas simplificá-la para uma variável dá a variância de um único como a separação em uma dimensão.

Qual a diferença entre Variance e Covariance?

• A diferença é a medida da dispersão / dispersão em uma população, enquanto a covariância é considerada como uma medida de variação de duas variáveis ​​aleatórias ou a força da correlação.

• A diferença pode ser considerada como um caso especial de covariância.

• A variância e a covariância dependem da magnitude dos valores de dados e não podem ser comparadas; portanto, eles são normalizados. A covariância é normalizada para o coeficiente de correlação (dividindo pelo produto dos desvios padrão das duas variáveis ​​aleatórias) e a variância é normalizada para o desvio padrão (tomando a raiz quadrada)