Diferença entre regressão linear e logística: regressão linear vs regressão logística

Anonim

Regressão linear vs logística

Na análise estatística, é importante identificar as relações entre variáveis ​​em questão para o estudo. Às vezes, pode ser o único propósito da própria análise. Uma ferramenta forte empregada para estabelecer a existência de relacionamento e identificar a relação é a análise de regressão.

A forma mais simples de análise de regressão é a regressão linear, onde a relação entre as variáveis ​​é uma relação linear. Em termos estatísticos, traz a relação entre a variável explicativa e a variável de resposta. Por exemplo, usando a regressão, podemos estabelecer a relação entre o preço da commodity e o consumo com base em dados coletados de uma amostra aleatória. A análise de regressão produzirá uma função de regressão do conjunto de dados, que é um modelo matemático que melhor se adequa aos dados disponíveis. Isso pode ser facilmente representado por um gráfico de dispersão. A regressão gráfica equivale a encontrar a melhor curva de ajuste para o dado conjunto de dados. A função da curva é a função de regressão. Usando o modelo matemático, o uso de uma mercadoria pode ser previsto para um determinado preço.

Portanto, a análise de regressão é amplamente utilizada na previsão e previsão. Também é usado para estabelecer as relações em dados experimentais, nos campos da física, química e em muitas ciências naturais e disciplinas de engenharia. Se o relacionamento ou a função de regressão é uma função linear, o processo é conhecido como regressão linear. No gráfico de dispersão, ele pode ser representado como uma linha reta. Se a função não é uma combinação linear dos parâmetros, a regressão não é linear.

A regressão logística é comparável à regressão multivariada e cria um modelo para explicar o impacto de preditores múltiplos em uma variável de resposta. No entanto, na regressão logística, a variável resultado final deve ser categórica (geralmente dividida; i. E., Um par de resultados alcançáveis, como a morte ou a sobrevivência, embora técnicas especiais permitam modelar mais informações categorizadas). Uma variável de resultado contínua pode ser transformada em uma variável categórica, para ser usada para regressão logística; no entanto, colapsar variáveis ​​contínuas desta maneira é principalmente desencorajado porque reduz a precisão.

Ao contrário da regressão linear, em relação à média, as variáveis ​​preditoras na regressão logística não precisam ser compelidas a serem conectadas linearmente, comumente distribuídas ou ter variância igual dentro de cada cluster.Como resultado, a relação entre o preditor e as variáveis ​​de resultado não é provável que seja uma função linear.

Qual a diferença entre regressão logística e linear?

• Na regressão linear, uma relação linear entre a variável explicativa e a variável de resposta é assumida e os parâmetros que satisfazem o modelo são encontrados por análise, para dar a relação exata.

• A regressão linear é realizada para variáveis ​​quantitativas, e a função resultante é quantitativa.

• Na regressão logística, os dados utilizados podem ser categóricos ou quantitativos, mas o resultado é sempre categórico.