1 / 34
文档名称:

机器学习简介.ppt

格式:ppt   大小:1,742KB   页数:34页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机器学习简介.ppt

上传人:977562398 2022/6/24 文件大小:1.70 MB

下载得到文件列表

机器学习简介.ppt

相关文档

文档介绍

文档介绍:机器学****简介
第一页,共34页。
目录
机器学****的定义
机器学****的发展历史和现状
机器学****的分类
机器学****的常见算法
器人控制等。常见算法包括Q-Learning 以及时间差学****Temporal difference learning)。
第十一页,共34页。
机器学****的分类 -– 总结
4
在企业数据应用的场景下,人们最常用的可能就是监督式学****和无监督式学****的模型。
在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数据,目前半监督式学****是一个很热的话题。
强化学****更多地应用在机器人控制及其他需要进行系统控制的领域。
第十二页,共34页。
机器学****的常见算法
5
回归算法(监督学****br/>神经网络(监督学****br/>SVM支持向量机(监督学****br/>聚类算法(无监督学****br/>降维算法(无监督学****br/>推荐算法(特殊)
其他算法
第十三页,共34页。
常见算法 -– 回归算法
5
回归算法有两个重要的子类:即线性回归和逻辑回归;
线性回归就是如何拟合出一条直线最佳匹配所有的数据,逻辑回归是一种与线性回归非常类似的算法;
线性回归处理的问题类型与逻辑回归不一致:
线性回归处理的是数值问题,也就是最后预测出的结果是数字,例如房价。
逻辑回归属于分类算法,也就是说,逻辑回归预测结果是离散的分类,例如判断这封邮件是否是垃圾邮件,以及用户是否会点击此广告等等。
第十四页,共34页。
常见算法 -– 回归算法
5
假设有一组肿瘤患者的数据,这些患者的肿瘤中有些是良性的(图中的蓝色点),有些是恶性的(图中的红色点)。这里肿瘤的红蓝色可以被称作数据的“标签”。同时每个数据包括两个“特征”:患者的年龄与肿瘤的大小。我们将这两个特征与标签映射到这个二维空间上,形成了上图的数据。
当有一个绿色的点时,该判断这个肿瘤是恶性的还是良性的呢?根据红蓝点我们训练出了一个逻辑回归模型,也就是图中的分类线。这时,根据绿点出现在分类线的左侧,因此我们判断它的标签应该是红色,也就是说属于恶性肿瘤。
逻辑回归算法划出的分类线基本都是线性的(也有划出非线性分类线的逻辑回归,不过那样的模型在处理数据量较大的时候效率会很低),这意味着当两类之间的界线不是线性时,逻辑回归的表达能力就不足。
第十五页,共34页。
常见算法 -– 神经网络
5
神经网络(也称之为人工神经网络,ANN)的诞生起源于对大脑工作机理的研究。早期生物界学者们使用神经网络来模拟大脑,后来,机器学****的学者们使用神经网络进行机器学****的实验,发现在视觉与语音的识别上效果都相当好。
神经网络算法是80年代机器学****界非常流行的算法。不过,进入90年代,神经网络的发展进入了一个瓶颈期。其主要原因是神经网络的训练过程很困难。
现在,携着“深度学****之势,神经网络重装归来,重新成为最强大的机器学****算法之一。
第十六页,共34页。
常见算法 -– 神经网络
5
比方说,一个正方形,分解为四个折线进入视觉处理的下一层中。四个神经元分别处理一个折线。每个折线再继续被分解为两条直线,每条直线再被分解为黑白两个面。于是,一个复杂的图像变成了大量的细节进入神经元,神经元处理以后再进行整合,最后得出了看到的是正方形的结论。这就是大脑视觉识别的机理,也是神经网络工作的机理。
第十七页,共34页。
常见算法 -– SVM支持向量机
5
SVM算法是诞生于统计学****界,同时在机器学****界大放光彩的经典算法。
从某种意义上来说,支持向量机算法是逻辑回归算法的强化:通过给予逻辑回归算法更严格的优化条件,支持向量机算法可以获得比逻辑回归更好的分类界线。
支持向量机是一种数学成分很浓的机器学****算法(相对的,神经网络则有生物科学成分)。通过支持向量机算法,既可以保持计算效率,又可以获得非常好的分类效果。因此支持向量机在90年代后期一直占据着机器学****中最核心的地位,基本取代了神经网络算法。直到现在神经网络借着深度学****重新兴起,两者之间才又发生了微妙的平衡转变。
第十八页,共34页。
常见算法 -– SVM支持向量机
5
通过跟高斯函数的结合,支持向量机可以表达出非常复杂的分类界线,从而达成很好的分类效果。比如,可以将低维的空间映射到高维的空间。
如何在二维平面划分出一个圆形的分类界线?在二维平面可能会很困难,但是通过高斯函数可以将二维空间映射到三维空间,然后使用一个线性平面就可以达成类似效果。
第十九页,共34页。
常见算法 -– 聚类算法
5
聚类算法是无监督学****算法中最典型的代表。
聚类算法就是计算种群中的距离,根据距离的远近将数