数据挖掘和数据仓库有关联吗?

数据挖掘和数据仓库都是商业智能工具,用于将信息(或数据)转化为可操作的知识。这两种工具之间的重要区别在于它们各自实现目标所使用的方法和流程。

数据挖掘是一个统计分析过程。分析师使用技术工具查询和整理数TB的数据,以寻找模式。通常,分析师会提出一个假设,例如购买产品X的客户通常会在六个月内购买产品Y。对相关数据运行查询以证明或反驳这一理论就是数据挖掘。企业随后利用这些信息,根据对客户和供应商行为的理解,做出更好的商业决策。

广告

数据仓库描述的是设计数据存储方式以改进报告和分析的过程。数据仓库专家认为,各种数据存储在概念上和物理上都是相互连接和关联的。企业的 H data 通常存储在多个数据库中。然而,为了能够分析最广泛的数据,每个数据库都需要以某种方式连接。这意味着它们内部的数据需要一种与其他相关数据关联的方式,并且物理数据库本身也需要连接,以便可以一起查看它们的数据以进行报告。

因此,数据挖掘和数据仓库之间关系的关键在于,经过适当仓库处理的数据更容易进行挖掘。如果数据挖掘查询必须遍历分布在不同物理网络上多个数据库中的数TB数据,那将不是一个高效的查询,获取结果需要很长时间。然而,如果数据仓库专家设计了一个能够紧密连接不同数据库中相关数据的数据存储系统,那么数据挖掘人员现在就可以运行更有意义和更高效的查询来改进业务。

广告

广告

加载中...