大量、不完全、噪声、模糊、随机地挖掘数据,发现隐含着对大数据有价值、潜在有用信息和知识的过程,也是一个决策支持过程。数据挖掘的基础是人工智能,机器学习,模式学习,统计等。接下来小编就为大家介绍介绍数据挖掘的四种基本方法,感兴趣的话不妨接着看下去吧!
数据挖掘的四种基本方法
(1)分类
分类是找出数据库中的一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到摸个给定的类别中。可以应用到涉及到应用分类、趋势预测中,如淘宝商铺将用户在一段时间内的购买情况划分成不同的类,根据情况向用户推荐关联类的商品,从而增加商铺的销售量。
(2)回归分析
回归分析反映了数据库中数据的属性值的特性,通过函数表达数据映射的关系来发现属性值之间的依赖关系。它可以应用到对数据序列的预测及相关关系的研究中去。在市场营销中,回归分析可以被应用到各个方面。如通过对本季度销售的回归分析,对下一季度的销售趋势作出预测并做出针对性的营销改变。
(3)聚类
聚类类似于分类,但与分类的目的不同,是针对数据的相似性和差异性将一组数据分为几个类别。属于同一类别的数据间的相似性很大,但不同类别之间数据的相似性很小,跨类的数据关联性很低。
(4)关联规则
关联规则是隐藏在数据项之间的关联或相互关系,即可以根据一个数据项的出现推导出其他数据项的出现。关联规则的挖掘过程主要包括两个阶段:第一阶段为从海量原始数据中找出所有的高频项目组;第二极端为从这些高频项目组产生关联规则。关联规则挖掘技术已经被广泛应用于金融行业企业中用以预测客户的需求,各银行在自己的ATM机上通过捆绑客户可能感兴趣的信息供用户了解并获取相应信息来改善自身的营销。
数据挖掘是一种决策支持过程,它通过高度自动化地分析企业的数据,做出归纳性的推理,减少风险,做出正确的决策,这对于一个企业的发展十分重要。以上就是数据挖掘的四种基本方法的全部内容了,相信大家在阅读过后应该对数据挖掘有了基础的了解了,希望能帮到大家。
[免责声明]
文章标题: 数据挖掘的四种基本方法
文章内容为网站编辑整理发布,仅供学习与参考,不代表本网站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时沟通。发送邮件至36dianping@36kr.com,我们会在3个工作日内处理。