1 / 34
文档名称:

机器学习简介.pptx

格式:pptx   大小:2,402KB   页数:34页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机器学习简介.pptx

上传人:1017079457 2020/2/20 文件大小:2.35 MB

下载得到文件列表

机器学习简介.pptx

文档介绍

文档介绍:机器学****2018-03-15目录机器学****的定义机器学****的发展历史和现状机器学****的分类机器学****的常见算法机器学****的基本过程机器学****的示例机器学****的常见应用流行的开源机器学****框架SparkMLlib介绍机器学****的定义1在维基百科上,对机器学****提出以下几种定义:“机器学****是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学****中改善具体算法的性能”;“机器学****是对能通过经验自动改进的计算机算法的研究”;“机器学****是用数据或以往的经验,以此优化计算机程序的性能标准”。机器学****的定义1三个关键词:算法、经验、性能机器学****是数据通过算法构建出模型并对模型进行评估,评估的性能如果达到要求就拿这个模型来测试其他的数据,如果达不到要求就调整算法来重新建立模型,再次进行评估,如此循环往复,最终获得满意的经验来处理其他的数据。机器学****的发展历史2机器学****是人工智能应用研究比较重要的分支,它的发展过程大体上可分为4个阶段:第一阶段是在50年代中叶到60年代中叶,属于热烈时期;第二阶段在60年代中叶至70年代中叶,被称为机器学****的冷静时期;第三阶段从70年代中叶至80年代中叶,称为复兴时期;机器学****的最新阶段始于1986年。一方面,由于神经网络研究的重新兴起,另一方面,对实验研究和应用研究得到前所未有的重视。我国的机器学****研究开始进入稳步发展和逐渐繁荣的新时期。机器学****的发展现状3在搜索引擎方面Google的成功,搜索引擎成为新兴产业。机器学****技术正在支撑着各类搜索引擎;DARPA(美国国防先进研究项目局)于2003年开始启动5年期PAL计划,这是一个以机器学****为核心的计划(涉及到AI的其他分支,如知识表示和推理、自然语言处理等);汽车自动驾驶。机器学****的主要任务是从立体视觉中学****如何行驶,根据观察人类的驾驶行为记录各种图像和操纵指令,并将它们进行正确分类;在对天文物体进行分类、计算机系统性能预测、信用卡盗用检测、邮政服务属性识别、网络文档自动分类等方面,机器学****也在快速发展壮大。机器学****的分类4监督学****无监督学****半监督学****强化学****机器学****的分类-–监督学****4监督学****是从给定的训练数据集中学****一个函数(模型),当新的数据到来时,可以根据这个函数(模型)预测结果;在监督式学****下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如,对防垃圾邮件系统中“垃圾邮件”、“非垃圾邮件”;在建立模型时,监督式学****建立一个学****过程,将预测结果与“测试数据”的实际结果进行比较,不断调整预测模型,直到模型的预测结果达到一个预期的准确率。常见的监督学****算法包括回归分析和统计分类。机器学****的分类-–无监督学****4在无监督式学****中,数据并不被特别标识,学****模型是为了推断出数据的一些内在结构;常见的应用场景包括关联规则的学****以及聚类等。常见算法包括Apriori算法和k-Means算法。监督学****和无监督学****的区别:训练集目标是否被标注。他们都有训练集,且都有输入和输出。机器学****的分类-–半监督学****4半监督学****是介于监督学****与无监督学****之间一种机器学****方式,主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题;应用场景包括分类和回归,算法包括一些对常用监督式学****算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测,如图论推理算法(GraphInference)或者拉普拉斯支持向量机(LaplacianSVM)等;半监督学****从诞生以来,主要用于处理人工合成数据,无噪声干扰的样本数据是当前大部分半监督学****方法使用的数据,而在实际生活中用到的数据却大部分不是无干扰的,通常都比较难以得到纯样本数据。