Diferença entre mineração de dados e OLAP

Anonim

baseada em computador> Tanto a mineração de dados quanto o OLAP são duas das tecnologias comuns de Business Intelligence (BI). A inteligência de negócios refere-se a métodos baseados em computador para identificar e extrair informações úteis de dados comerciais. A mineração de dados é o campo da ciência da computação, que lida com a extração de padrões interessantes de grandes conjuntos de dados. Ele combina muitos métodos de inteligência artificial, estatística e gerenciamento de banco de dados. O OLAP (processamento analítico online), como o nome sugere, é uma compilação de formas de consultar bases de dados multidimensionais.

A mineração de dados também é conhecida como descoberta de conhecimento em dados (KDD). Como mencionado acima, é um campo de informática, que trata da extração de informações anteriormente desconhecidas e interessantes de dados brutos. Devido ao crescimento exponencial dos dados, especialmente em áreas como negócios, a mineração de dados tornou-se uma ferramenta muito importante para converter esta grande riqueza de dados em inteligência de negócios, uma vez que a extração manual de padrões se tornou aparentemente impossível nas últimas décadas. Por exemplo, atualmente é usado para várias aplicações, como análise de rede social, detecção de fraude e marketing. A mineração de dados geralmente trata das seguintes quatro tarefas: agrupamento, classificação, regressão e associação. Clustering está identificando grupos similares a partir de dados não estruturados. A classificação é regras de aprendizagem que podem ser aplicadas a novos dados e, normalmente, incluem as seguintes etapas: pré-processamento de dados, modelagem, seleção de recursos / aprendizagem e avaliação / validação. A regressão é encontrar funções com erro mínimo para dados do modelo. E a associação procura relacionamentos entre variáveis. A mineração de dados geralmente é usada para responder perguntas como quais são os principais produtos que podem ajudar a obter alto lucro no próximo ano no Wal-Mart.

OLAP é uma classe de sistemas, que fornece respostas para consultas multidimensionais. Normalmente, OLAP é usado para marketing, orçamento, previsão e aplicações similares. Escusado será dizer que os bancos de dados usados ​​para o OLAP são configurados para consultas complexas e ad hoc com um desempenho rápido em mente. Normalmente, uma matriz é usada para exibir a saída de um OLAP. As linhas e as colunas são formadas pelas dimensões da consulta. Eles costumam usar métodos de agregação em tabelas múltiplas para obter resumos. Por exemplo, ele pode ser usado para descobrir as vendas desse ano no Wal-Mart em relação ao ano passado? Qual é a previsão das vendas no próximo trimestre? O que pode ser dito sobre a tendência, observando a mudança percentual?

Embora seja óbvio que a mineração de dados e OLAP são semelhantes, porque eles operam em dados para obter inteligência, a principal diferença vem de como eles operam em dados.As ferramentas OLAP fornecem análises de dados multidimensionais e fornecem resumos dos dados, mas, de forma contrastante, a mineração de dados se concentra em índices, padrões e influências no conjunto de dados. Esse é um acordo OLAP com agregação, que se resume à operação de dados via "adição", mas a mineração de dados corresponde a "divisão". Outra diferença notável é que, enquanto as ferramentas de mineração de dados modelam dados e retornam regras acionáveis, o OLAP realizará técnicas de comparação e contraste ao longo da dimensão do negócio em tempo real.