Diferença entre classificação e regressão

Anonim

Classificação vs Regressão

A classificação e a regressão são técnicas de aprendizagem para criar modelos de previsão a partir de dados coletados. Ambas as técnicas são apresentadas graficamente como árvores de classificação e regressão ou, em vez disso, fluxogramas com divisões de dados após cada passo, ou melhor, "ramificação" na árvore. Este processo é chamado de particionamento recursivo.

Classificação

A classificação é uma técnica usada para chegar a um esquema que mostra a organização dos dados começando com uma variável precursora. As variáveis ​​dependentes são o que classifica os dados em grupos. A árvore de classificação começa com a variável independente, que se ramifica em dois grupos conforme determinado pelas variáveis ​​dependentes existentes. É necessário elucidar as respostas na forma de categorização provocada pelas variáveis ​​dependentes.

Regressão

A regressão é um método de previsão baseado em um valor de saída numérico assumido ou conhecido. Este valor de saída é o resultado de uma série de particionamento recursivo, com cada passo com um valor numérico e outro grupo de variáveis ​​dependentes que se ramificam para outro par, como este. A árvore de regressão começa com uma ou mais variáveis ​​precursoras e termina com uma variável de saída final. As variáveis ​​dependentes são variáveis ​​numéricas contínuas ou discretas.

Qual a diferença entre Classificação e Regressão

A principal diferença entre a árvore de classificação e a árvore de regressão é sua variável dependente. Para a árvore de classificação, as variáveis ​​dependentes são categóricas, enquanto a árvore de regressão possui variáveis ​​numéricas dependentes. Os da árvore de classificação também possuem uma quantidade definida de valores não ordenados, enquanto os da árvore de regressão possuem valores discretos, mas encomendados ou valores indiscretos. Uma árvore de regressão é construída com o objetivo de ajustar um sistema de regressão a cada ramo determinante de forma a que o valor de saída esperado apareça. Por outro lado, uma árvore de classificação se ramifica conforme determinado por uma variável dependente derivada do nó anterior.

As árvores de regressão e classificação são técnicas úteis para mapear o processo que aponta para um resultado estudado, seja na classificação ou em um único valor numérico.

Em resumo:

• As árvores de classificação possuem variáveis ​​dependentes que são categóricas e desordenadas.

• As árvores de regressão possuem variáveis ​​dependentes que são valores contínuos ou valores inteiros ordenados.