机器学习的分类有哪些

机器学习分类有:1、监督学习;2、无监督学习;3、半监督学习;4、强化学习。其中,监督学习是指:训练机器学习的模型的训练样本数据有对应的目标值,通过对数据样本因子和已知的结果建立联系。

机器学习的分类有哪些-Worktile社区

(1)监督学习

监督学习就是训练机器学习的模型的训练样本数据有对应的目标值,监督学习就是通过对数据样本因子和已知的结果建立联系,提取特征值和映射关系,通过已知的结果,已知数据样本不断的学习和训练,对新的数据进行结果的预测。

监督学习通常用在分类和回归。比如手机识别垃圾短信,电子邮箱识别垃圾邮件,都是通过对一些历史短信、历史邮件做垃圾分类的标记,对这些带有标记的数据进行模型训练,然后获取到新的短信或是新的邮件时,进行模型匹配,来识别此邮件是或是不是,这就是监督学习下分类的预测。

再举一个回归的例子,比如我们要预测公司净利润的数据,我们可以通过历史上公司利润(目标值),以及跟利润相关的指标,比如营业收入、资产负债情况、管理费用等数据,通过回归的方式我们回到的一个回归方程,建立公司利润与相关因此的方程式,通过输入因子数据,来预测公司利润。

监督学习难点是获取具有目标值的样本数据成本较高,成本高的原因在于这些训练集的要依赖人工标注工作。

(2)无监督学习

无监督学习跟监督学习的区别就是选取的样本数据无需有目标值,我们无需分析这些数据对某些结果的影响,只是分析这些数据内在的规律。

无监督学习常用在聚类分析上面。比如客户分群、因子降维等。比如RFM模型的使用,通过客户的销售行为(消费次数、最近消费时间、消费金额)指标,来对客户数据进行聚类:

重要价值客户:最近消费时间近、消费频次和消费金额都很高;重要保持客户:最近消费时间较远,但消费频次和金额都很高,说明这是个一段时间没来的忠诚客户,我们需要主动和他保持联系;重要发展客户:最近消费时间较近、消费金额高,但频次不高,忠诚度不高,很有潜力的用户,必须重点发展;重要挽留客户:最近消费时间较远、消费频次不高,但消费金额高的用户,可能是将要流失或者已经要流失的用户,应当基于挽留措施。除此之外,无监督学习也适用于降维,无监督学习比监督学习好处是数据不需要人工打标记,数据获取成本低。

(3)半监督学习

半监督学习是监督学习和无监督学习相互结合的一种学习方法,通过半监督学习的方法可以实现分类、回归、聚类的结合使用。

半监督分类:是在无类标签的样例的帮助下训练有类标签的样本,获得比只用有类标签的样本训练得到更优的分类;半监督回归:在无输出的输入的帮助下训练有输出的输入,获得比只用有输出的输入训练得到的回归器性能更好的回归;半监督聚类:在有类标签的样本的信息帮助下获得比只用无类标签的样例得到的结果更好的簇,提高聚类方法的精度;半监督降维:在有类标签的样本的信息帮助下找到高维输入数据的低维结构,同时保持原始高维数据和成对约束的结构不变。半监督学习是最近比较流行的方法。

(4)强化学习

强化学习是一种比较复杂的机器学习方法,强调系统与外界不断的交互反馈,它主要是针对流程中不断需要推理的场景,比如无人汽车驾驶,它更多关注性能。它是机器学习中的热点学习方法。

文章标题:机器学习的分类有哪些,发布者:小编,转载请注明出处:https://worktile.com/kb/p/30325

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022年10月12日 下午11:37
下一篇 2022年10月12日 下午11:53

相关推荐

  • 工作流管理系统的核心是什么

    工作流管理系统的核心是“工作流引擎”,又被称为工作流执行部件,它主要提供对工作流定义的解析以及流程流转的支持。基于工作流引擎,企业可以构建客户关系管理系统、运输管理系统、仓库管理系统、财务费用管理系统等复杂业务系统。 1.工作流管理系统的组成 工作流管理系统是一种软件系统,它完成工作量的定义和管理,…

    2022年11月15日
    12600
  • python有哪些注释方式

    python有以下注释方式:1、单行注释;2、多行注释;3、编码注释;4、平台注释。单行注释是指在Python中,一般的单行注释都是使用的#号开头,它可以在单独的一行代码中使用,或者是放在一个表达式或者是语句之后使用。 1、单行注释 在Python中,一般的单行注释都是使用的#号开头,它可以在单独的…

    2023年1月15日
    1800
  • C,C++,C#,Java分别擅长开发什么方面的软件

    C语言擅长开发系统程序、驱动程序、实现复杂的算法和对性能要求很高的程序。c++可以开发系统程序和开发性能很高的应用程序,如游戏引擎。c#和java一般用于开发各种类型的应用程序,如网络程序、游戏程序等。 c语言 c语言擅长开发系统程序、驱动程序、实现复杂的算法和对性能要求很高的程序,也可以用于嵌入式…

    2023年2月21日
    4700
  • websocket、TCP实现即时通信的区别

    区别是:WebSocket是一种在单个TCP连接上进行全双工通信的协议。WebSocket通信协议于2011年被IETF定为标准RFC 6455,并由RFC7936补充规范。WebSocket API也被W3C定为标准。TCP,即传输控制协议是一种面向连接的、可靠的、基于字节流的传输层通信协议,由I…

    2023年2月13日
    1300
  • b2b,b2c模式是什么意思

    b2b模式的意思是指企业与企业之间通过专用网络或Internet,进行数据信息的交换、传递,开展交易活动的商业模式,b2c模式的意思是指企业对消费者的电子商务模式,是直接面向消费者销售产品和服务商业的零售模式。 一、b2b模式 1、概念 b2b模式的意思是指企业与企业之间通过专用网络或Interne…

    2023年3月17日
    800
  • 什么是scrum方法

    Scrum是一种敏捷开发方法,旨在加速团队的协作和交付。它是一种基于迭代和增量交付的方法,主要应用于软件开发领域。在本文中,我们将详细介绍什么是Scrum以及它的工作原理。 什么是Scrum? Scrum是一种敏捷方法,它可以帮助团队更好地管理和完成项目。它的核心思想是使团队能够在短时间内交付高质量…

    2023年3月2日
    1900
  • Java如何读取txt文件的内容

    Java采用流的方式读取txt文件。TXT是一个文本文件一般采用流的方式读取,java提供了一个FileInputStream,我们可以直接以文件路径构造这个流,也可以以文件对象构造他。然后使用这个流就可以直接读取到文件了。 TXT是一个文本文件,一般采用流的方式读取: java提供了一个FileI…

    2023年1月31日
    7700
  • 如何决策产品中待开发功能的优先级?

    决策产品中待开发功能的优先级的依据:1、问题规模;2、商业价值;3、资源考量;4、团队目标;5、风险测试;6、评估模型。其中,问题规模包含使用者针对该需求提出的数量与频率、该问题影响到使用者数量等。 1、问题规模 沟通对象:用户/客户、业务、客服、社群、用户研究员 对于以使用者为中心的产品设计团队,…

    2023年1月3日
    2700
  • 免费ftp服务器空间有哪些

    免费ftp服务器空间有:1、FileZilla;2、FireFTP;3、蒙斯塔FTP;4、赛博鸭;5、智能FTP;6、WinSCP;7、经典FTP;8、单键FTP;9、gFTP。FileZilla是是最有前途和最受欢迎的FTP客户端之一。FileZilla速度很快,可以处理同时传输,并支持跨平台的F…

    2022年12月31日
    26300
  • 测试用例设计要素有哪些

    测试用例设计要素有以下几点:1、基于需求;2、场景化;3、描述精准;4、可判定;5、原子化;6、可回归;7、独立;8、正交。其中,基于需求要求测试用例是为了验证需求而设计的,则应避免过度设计,从需求出发,设计能有效验证需求的测试用例。 一、测试用例有哪些设计原则? 测试用例设计需要遵循以下原则:基于…

    2022年12月21日
    6900

发表回复

登录后才能评论
联系我们
关注微信
关注微信
分享本页
返回顶部
PingCode 比 Jira 更好用的研发管理工具。免费试用         文章及站点合作,请添加微:All-FeiFei