大数据,数据挖掘,机器学习的区别

大数据,数据挖掘,机器学习的区别主要是本质上的不同。大数据是互联网的海量数据挖掘,而数据挖掘更多是从数据中提取潜在的、有价值的信息。机器学习是让计算机能够自动地从某些数据中总结规律,并得出某种预测模型,进而利用该模型对未知数据进行预测的方法。

大数据,数据挖掘,机器学习的区别

一、本质不同

1、大数据(big data)

指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

2、机器学习(Machine Learning)

本质上就是让计算机自己在数据中学习规律,并根据所得到的规律对未来数据进行预测。机器学习包括如聚类、分类、决策树、贝叶斯、神经网络、深度学习(Deep Learning)等算法。机器学习的基本思路是模仿人类学习行为的过程,如我们在现实中的新问题一般是通过经验归纳,总结规律,从而预测未来的过程。

3、数据挖掘(Data mining)

又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

延伸阅读

数据挖掘应用领域

目前数据挖掘在各行各业应用广泛,尤其在金融、保险、电子商务和电信方面得到了很好的效果,简单阐述一下在金融行业数据挖掘的应用。

(1)风险控制(贷款偿还预测和客户信用评价)

有很多因素会对货款偿还效能和客户信用等级计算产生不同程度的影响。数据挖掘的方法,如特征选择和属性相关性计算,有助于识别重要的因素和非相关因素。例如,与货款偿还风险相关的因素,包括货款率、贷款期限、负债率、偿还与收入(payment—to—income)比率、客户收入水平、受教育程度、居住地区、信用历史等等。而其中偿还与收入比率是主导因素,受教育水平和负债率则不是。银行可以据此调整货款发放政策,以便将货款发放给那些曾被拒绝但根据关键因素分析,其基本信息显示是相对低风险的申请者。

(2)交叉销售(业务关联分析)

通过关联分析可找出数据库中隐藏的关联网,银行存储了大量的客户交易信息,可对客户的收入水平、消费习惯、购买物品等指标进行挖掘分析,找出客户的潜在需求;并对各个理财产品进行交叉分析,找出关联性较强的产品,从而对客户进行有针对性的关联营销,提高银行业绩。

(3)客户市场细分

根据银行大量的客户资料以及客户存储款情况,利用有效的聚类或者协同过滤,将客户有效地划分为不同的组,使得具有相同存储和贷款行为的客户分为一组,从而可以对每一组总结各自每个组的特点,对每个组开展有针对性活动。

此外,针对不同的客户类型(例如大客户类型,潜在价值高,但是忠诚度很难保持)设计出量体裁衣的产品组合、沟通方式,以及客户服务,从而达到提高客户忠诚度、实现关联销售、优异化定价、产品直销、产品再设计,以及渠道管理的目的。而这些目标的实现,致使客户管理总体成本降低,客户关系得以改善,最终成功实现零售业务块利润率的提高。

(4)客户流失预警

根据客户属性特征、存储款、贷款、金融产品使用等数据,运用数据挖掘技术,找到流失客户的共同特征,从而针对具有相似特征的客户还未流失前,进行有针对性的弥补或者营销活动,从而起到避免客户流失到其他公司的作用,起到稳定本企业客户的作用。

(5)新客户开发以及新产品推广

通过探索性的数据挖掘方法,如自动探测聚类和购物篮分析,可以用来找出客户数据库中的特征,预测对于银行营销活动的响应率。那些被定为有利的特征可以与新的非客户群进行匹配,以增加营销活动的效果。

数据挖掘还可从银行数据库存储的客户信息中,可以根据事先设定的标准找到符合条件的客户群,也可以把客户进行聚类分析让其自然分群,通过对客户的服务收入、风险、成本等相关因素的分析、预测和优化,找到新的可赢利目标客户。

(6)贷款偿还预测

贷款偿还预测对银行业务相当重要的。贷款偿还风险相关的因素包括贷款率,贷款期限,负债率(月负债总额与月收入总额之比),偿还与收入比率(payment-to-income),客户收入水平,受教育水平,居住信息,信用历史等等,通过数据挖掘预测手段,可以提早预测哪些用户有可能偿还违约,哪些用户曾经贷款被拒但是预测结果却是低风险。

(7)反洗钱活动

金融交易活动是洗钱犯罪行为的一个重要环节,通过分析金融机构的客户信息和交易数据,运用合适的数据挖掘方法,介乎客户背景,识别出可疑金融交易记录,最后根据贝叶斯判定原理,综合各个层次的可疑信息,得到交易记录的整体可疑度,最终为反洗钱监测提供快速准确的参考。

(8)其他决策支持

比如营销活动预演,理财产品收益以及效果评估,多维分析报告等等。海量用户数据对于未来金融应用业务将非常关键,有大量的社交、支付、理财数据通过云计算还有专业的分析挖掘,能够为金融机构大幅的降低运营成本,还有服务成本,并提升风控的能力。

文章标题:大数据,数据挖掘,机器学习的区别,发布者:小编,转载请注明出处:https://worktile.com/kb/p/46814

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小编的头像小编

发表回复

登录后才能评论
注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部