1 / 2
文档名称:

机器学习算法介绍.pdf

格式:pdf   大小:1,497KB   页数:2页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机器学习算法介绍.pdf

上传人:三角文案 2022/10/8 文件大小:1.46 MB

下载得到文件列表

机器学习算法介绍.pdf

文档介绍

文档介绍:该【机器学习算法介绍 】是由【三角文案】上传分享,文档一共【2】页,该文档可以免费在线阅读,需要了解更多关于【机器学习算法介绍 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。188IT 经理世界2020年06月 第23卷 第6期
机器学****算法介绍
丁云波 张寅 何坤 王南 王兰
(四川华西集采电子商务有限公司 四川 成都 610000)
[摘要]近年来,机器学****算法受到广泛关注,并且取得了大量的研究成果。文中,主要就对机器学****算法进行了介绍,希望可以加
深对机器学****的认识。
[关键词]机器学****人工智能;算法
[中图分类号]TP29[文献标识码]A
引言我们准备了一大堆猫和狗的照片,我们想让机器学会如何识别猫
当前,机器学****已经成为了一个热门词汇,但是很多人对于机器和狗。当我们使用监督学****的时候,我们需要给这些照片打上标签。
学****缺乏正确的认识。为了帮助大家加深对机器学****的认识,接下来机器通过大量学****就可以学会在新照片中认出猫和狗。
就对机器学****进行介绍。这种通过大量人工打标签来帮助机器学****的方式就是监督学****br/>这种学****方式效果非常好,但是成本也非常高[2]。
1什么是机器学****br/>
、人工智能、深度学****的关系?
非监督学****中,给定的数据集没有“正确答案”,所有的数据
机器学****不是某种具体的算法,而是很多算法的统称。
都是一样的。无监督学****的任务是从给定的数据集中,挖掘出潜在的
机器学****包含了很多种不同的算法,深度学****就是其中之一,其
结构。
他方法包括决策树,聚类,贝叶斯等。
举个例子:
深度学****的灵感来自大脑的结构和功能,即许多神经元的互连。
我们把一堆猫和狗的照片给机器,不给这些照片打任何标签,但
人工神经网络(ANN)是模拟大脑生物结构的算法[1]。
是我们希望机器能够将这些照片分分类。
不管是机器学****还是深度学****都属于人工智能(AI)的范畴。
通过学****机器会把这些照片分为2类,一类都是猫的照片,一
而深度学****是机器学****的一种方法。
类都是狗的照片。虽然跟上面的监督学****看上去结果差不多,但是有

着本质的差别:
①把现实生活中的问题抽象成数学模型,并且很清楚模型中不同非监督学****中,虽然照片分为了猫和狗,但是机器并不知道哪个
参数的作用是猫,哪个是狗。对于机器来说,相当于分成了A、B两类。
②利用数学方法对这个数学模型进行求解,
的问题
它关注的是智能体如何在环境中采取一系列行为,从而获得最大
③评估这个数学模型,是否真正的解决了现实生活中的问题,解
的累积回报。通过强化学****一个智能体应该知道在什么状态下应该
决的如何?[3]
采取什么行为。最典型的场景就是打游戏。

3机器学****的步骤
以监督学****为例,给大家讲解一下机器学****的实现原理。
假如我们正在教小朋友识字(一、二、三)。
3张卡片,然后便让小朋友看卡片,一边说“一条横线的是一、两条横我们在超市买来一堆不同种类的啤酒和红酒,然后再买来测量颜
线的是二、三条横线的是三”。色的光谱仪和用于测量酒精度的设备。
不断重复上面的过程,小朋友的大脑就在不停的学****这个时候,我们把买来的所有酒都标记出他的颜色和酒精度。
当重复的次数足够多时,小朋友就学会了一个新技能——认识汉这一步非常重要,因为数据的数量和质量直接决定了预测模型的
字:一、二、三。好坏。
我们用上面人类的学****过程来类比机器学****br/>到的人类学****过程很相似。在这个例子中,我们的数据是很工整的,但是在实际情况中,我
上面提到的认字的卡片在机器学****中叫——训练集们收集到的数据会有很多问题,所以会涉及到数据清洗等工作。
上面提到的“一条横线,两条横线”这种区分不同汉字的属性当数据本身没有什么问题后,我们将数据分成3个部分:训练集
叫——特征(60%)、验证集(20%)、测试集(20%),用于后面的验证和评估
[4]
小朋友不断学****的过程叫——建模工作。
学会了识字后总结出来的规律叫——
通过训练集,不断识别特征,不断建模,最后形成有效的模型,研究人员和数据科学家多年来创造了许多模型。有些非常适合
这个过程就叫“机器学****图像数据,有些非常适合于序列(如文本或音乐),有些用于数字数
2机器学****的分类据,有些用于基于文本的数据。


大部分人都认为这个是最重要的部分,其实并非如此,数据数量
机器学****根据训练方法大致可以分为3大类:①监督学****非
和质量、还有模型的选择比训练本身重要更多(训练知识台上的3分
监督学****强化学****br/>钟,更重要的是台下的10年功)。


监督学****是指我们给算法一个数据集,并且给定正确答案。机器
一旦训练完成,就可以评估模型是否有用。这是我们之前预留
通过数据来学****正确答案的计算方法。
的验证集和测试集发挥作用的地方。评估的指标主要有准确率、召回
举个例子:
作者简介:丁云波(-),男,硕士,教授级高工,研究方向:工程师。
万方数据
IT 经理世界2020年06月 第23卷 第6期189
率、F值。文中只是对机器学****进行了简单的介绍,希望可以让人们对机器学****br/>。
完成评估后,您可能希望了解是否可以以任何方式进一步改进训参考文献
练。我们可以通过调整参数来做到这一点。当我们进行训练时,我们
[1][J].科技传播,2019(06):153-
隐含地假设了一些参数,我们可以通过认为的调整这些参数让模型表
154.
现的更出色[5]。
[2]周捷,[J].软
(开始使用)
件,2019(07):205-208.
我们上面的6个步骤都是为了这一步来服务的。这也是机器学****3][J].现代
的价值。这个时候,当我们买来一瓶新的酒,只要告诉机器他的颜色信息科技,2019,3(03):32-33.
和酒精度,他就会告诉你,这时啤酒还是红酒了。[4][J].电子技术与软件工
4结语程,2019(07):188.
总之,在人工智能领域中,机器学****是相当重要的组成部分。上[5]农汉琦,孙蕴琪,黄洁,
[J].计算机技术与发展,2020(05):125-131.
(上接第187页)
表3关键词词频由于计算机ip的限制很难对某一位、甚至某一批老师有针对性的
关注,这对图书馆资源针对性的引进有很大的难度。加上一些老师对
关键词词频
网上资源不够了解,很少在网上查询下载的缘故,对其科研产出与图
酒店4125书馆数字资源的记录更少之又少[5]。
旅游6529对于新引进的数字资源,图书馆必须加强宣传及用户辅导工作。
对读者需要的各种数字信息资源使用进行培训与辅导,强化科研人员
大学生1456
对数字资源的使用意识,提高用户的信息素养及使用技巧,同时也可
教学1639以提高图书馆数字资源的利用率。
互联网1217参考文献
茶叶1520[1][D].南京:南京
航空航天大学,2012.
物流2461
[2]——以河南
武夷山926师范大学化学与环境科学学院科研群体为例[J].河南科技学院
学报,2012(07):126-130.
3结语
[3]彭锦.“双一流”高校图书馆数字资源投入与科研产出分析[D].
通过以上统计分析可以看出,武夷学院科研群体在2017年到郑州大学,2018.
2020年所发表的文献期刊收录论文中多以武夷山本地,茶叶,旅游为[4]王英俭,-兼论对“创
主,4年内关于主题,武夷山,武夷学院,茶叶占据32%的比例,究新是第一动力,人才是第一资源”再认识[J].中国科学院院刊,
其原因既与学校对科研的重视以及科研政策关系密切,(10):1064-1071
字信息资源偏向于武夷山本地资源有很大关系。武夷学院近年来开始[5]王春梅;以学科为导向的高校资产资源绩效评价及优化配置研
引进一定量的数字资源,在多年的数字信息资源建设、使用与积累当究[D];华南理工大学;2018年
中,不仅对本地资源更加投入,也会对欠缺的方面有所补充。
万方数据