1 / 8
文档名称:

机器学习算法基础知识.doc

格式:doc   大小:20KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机器学习算法基础知识.doc

上传人:iris028 2019/12/10 文件大小:20 KB

下载得到文件列表

机器学习算法基础知识.doc

相关文档

文档介绍

文档介绍:机器学****算法基础知识2016-03-27数据玩家在我们了解了需要解决的机器学****问题的类型之后,我们可以开始考虑搜集来的数据的类型以及我们可以尝试的机器学****算法。在本文中,小编会介绍一遍最流行的机器学****算法。通过浏览主要的算法来大致了解可以利用的方法是很有帮助的。可利用的算法非常之多。困难之处在于既有不同种类的方法,也有对这些方法的扩展。这导致很快就难以区分到底什么才是正统的算法。在本文中,小编希望给你两种方式来思考和区分在这个领域中你将会遇到的算法。第一种划分算法的方式是根据学****的方式,第二种则是基于形式和功能的相似性(就像把相似的动物归为一类一样)。两种方式都是有用的。学****方式基于其与经验、环境,或者任何我们称之为输入数据的相互作用,一个算法可以用不同的方式对一个问题建模。在机器学****和人工智能教科书中,流行的做法是首先考虑一个算法的学****方式。算法的主要学****方式和学****模型只有几个,我们将会逐一介绍它们,并且给出几个算法和它们适合解决的问题类型来作为例子。·监督学****输入数据被称为训练数据,它们有已知的标签或者结果,比如垃圾邮件/非垃圾邮件或者某段时间的股票价格。模型的参数确定需要通过一个训练的过程,在这个过程中模型将会要求做出预测,当预测不符时,则需要做出修改。·无监督学****输入数据不带标签或者没有一个已知的结果。通过推测输入数据中存在的结构来建立模型。这类问题的例子有关联规则学****和聚类。算法的例子包括Apriori算法和K-means算法。·半监督学****输入数据由带标记的和不带标记的组成。合适的预测模型虽然已经存在,但是模型在预测的同时还必须能通过发现潜在的结构来组织数据。这类问题包括分类和回归。典型算法包括对一些其他灵活的模型的推广,这些模型都对如何给未标记数据建模做出了一些假设。·强化学****输入数据作为来自环境的激励提供给模型,且模型必须作出反应。反馈并不像监督学****那样来自于训练的过程,而是作为环境的惩罚或者是奖赏。典型问题有系统和机器人控制。算法的例子包括Q-学****和时序差分学****TemporalDifferenceLearning)。当你处理大量数据来对商业决策建模时,通常会使用监督和无监督学****目前一个热门话题是半监督学****比如会应用在图像分类中,涉及到的数据集很大但是只包含极少数标记的数据。算法相似性通常,我们会把算法按照功能和形式的相似性来区分。比如树形结构和神经网络的方法。这是一种有用的分类方法,但也不是完美的。仍然有些算法很容易就可以被归入好几个类别,比如学****矢量量化,它既是受启发于神经网络的方法,又是基于实例的方法。也有一些算法的名字既描述了它处理的问题,也是某一类算法的名称,比如回归和聚类。正因为如此,你会从不同的来源看到对算法进行不同的归类。就像机器学****算法自身一样,没有完美的模型,只有足够好的模型。在这个小节里,我将会按照我觉得最直观的方式列出许多流行的机器学****算法。虽然不管是类别还是算法都不是全面详尽的,但我认为它们都具有代表性,有助于你对整个领域有一个大致的了解。如果你发现有一个或一类算法没有被列入,将它写在回复里和大家分享。回归分析回归是这样一种建模方式,它先确定一个衡量模型预测误差的量,然后通过这个量来反复优化变量之间的关系。回归方法是统计学的主要应用,被归为统计机器学****这有些让人迷惑,因为我们可以用回归来指代一类