Diferença entre mineração de dados e armazenamento de dados

Anonim

Exploração de dados vs Data Warehousing

Mineração de dados e armazenamento de dados são técnicas muito poderosas e populares para analisar dados. Os usuários que se inclinam para as estatísticas usam a Data Mining. Eles utilizam modelos estatísticos para procurar padrões ocultos em dados. Os mineradores de dados estão interessados ​​em encontrar relações úteis entre diferentes elementos de dados, o que, em última instância, é lucrativo para as empresas. Mas, por outro lado, os especialistas em dados que podem analisar dimensões do negócio diretamente tendem a usar os data warehouses.

A mineração de dados também é conhecida como descoberta de conhecimento em dados (KDD). Como mencionado acima, é um campo de informática, que trata da extração de informações anteriormente desconhecidas e interessantes de dados brutos. Devido ao crescimento exponencial dos dados, especialmente em áreas como negócios, a mineração de dados tornou-se uma ferramenta muito importante para converter esta grande riqueza de dados em inteligência de negócios, uma vez que a extração manual de padrões se tornou aparentemente impossível nas últimas décadas. Por exemplo, atualmente é usado para várias aplicações, como análise de rede social, detecção de fraude e marketing. A mineração de dados geralmente trata das seguintes quatro tarefas: agrupamento, classificação, regressão e associação. Clustering está identificando grupos similares a partir de dados não estruturados. A classificação é regras de aprendizado que podem ser aplicadas a novos dados e geralmente incluirão as seguintes etapas: pré-processamento de dados, modelagem, seleção de recursos / aprendizagem e avaliação / validação. A regressão é encontrar funções com erro mínimo para dados do modelo. E a associação procura relacionamentos entre variáveis. A mineração de dados geralmente é usada para responder a perguntas como quais os principais produtos que podem ajudar a obter altos lucros no próximo ano no Wal-Mart?

Como mencionado acima, o armazenamento de dados também é usado para analisar dados, mas por diferentes conjuntos de usuários e um objetivo ligeiramente diferente em mente. Por exemplo, quando se trata do setor de varejo, os usuários de data warehousing estão mais preocupados com o tipo de compras que são populares entre os clientes, de modo que os resultados da análise podem ajudar o cliente melhorando a experiência do cliente. Mas os mineros de dados primeiro conjecturam uma hipótese, como os clientes que compram um certo tipo de produto e analisam os dados para testar a hipótese. O armazenamento de dados poderia ser realizado por um grande varejista que inicialmente armazena suas lojas com os mesmos tamanhos de produtos para depois descobrir que as lojas de Nova York vendem estoque de tamanho menor muito mais rápido do que nas lojas de Chicago. Então, ao analisar este resultado, o varejista pode armazenar a loja de Nova York com tamanhos menores comparados às lojas de Chicago.

Assim, como você pode ver claramente, esses dois tipos de análise parecem ser da mesma natureza a olho nu. Ambos se preocupam com o aumento dos lucros com base nos dados históricos. Mas é claro, existem diferenças importantes. Em termos simples, Data Mining e Data Warehousing são dedicados a fornecer diferentes tipos de análise, mas definitivamente para diferentes tipos de usuários. Em outras palavras, a Data Mining procura correlações, patches para suportar uma hipótese estatística. Mas, Data Warehousing responde uma pergunta comparativamente mais ampla e corta e corta dados a partir daí para reconhecer formas de melhoria no futuro.