1 / 17
文档名称:

有监督学习方法样稿.doc

格式:doc   大小:42KB   页数:17页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

有监督学习方法样稿.doc

上传人:业精于勤 2020/11/26 文件大小:42 KB

下载得到文件列表

有监督学习方法样稿.doc

文档介绍

文档介绍:非监督学****法
本章关键
什么叫非监督学****方法,什么叫有监督学****方法?
非监督学****方法关键用途
非监督学****方法两种基础处理方法:按分布密集程度划分,和按相同度聚类划分
按分布密度程度划分基础方法
动态聚类方法和分级聚类方法概念
经典动态聚类方法c-均值算法和isodata算法
使用非欧氏距离计算相同度动态聚类方法
分级聚类方法
本章课前思索题
假如给机器一维数据,机器能自动地找出其中存在规律吗?
有些人把非监督学****方法叫无老师学****而把第二章、第三章讨论内容成为有监督学****又称有老师学****你知道谁是老师吗?老师作用表现在哪里?
机器能总结数据中存在哪些规律呢?
机器能总结天气改变规律,给出天气预报吗?
机器能炒股吗?
非监督学****方法和数据相关系吗?
知识树
引 言
以前各章讨论分类器设计方法全部是在样本集中类别标签已知条件下进行,这些样本称为训练样本。在样本标签已知情况下,能够统计出各类训练样本不一样描述量,如其概率分布,或在特征空间分布区域等,利用这些参数进行分类器设计,称为有监督学****方法。然而在实际应用中,不少情况下无法预先知道样本标签,也就是说没有训练样本,所以只能从原先没有样本标签样本集开始进行分类器设计,这就是通常说无监督学****方法。对一个具体问题来说有监督和无监督作法是不相同。
大家日常生活中常常要观察事物和分析事物,从中寻求其规律性,这就是非监督学****方法要处理问题。,会发觉中间有一条带和图中其它区域不一样,。这就是事物(对我们来说就是数据集)本身表现出部分规律性,非监督学****方法就是寻求数据集中表现出来规律性。从中我们能够强调非监督学****和有监督学****方法以下多个不一样点:
1. 有监督学****方法必需要有训练集和测试样本。在训练集中找规律,而对测试样本使用这种规律;而非监督学****没有训练集这一说,只有一组数据,在该组数据集内寻求规律。
2. 有监督学****方法目标就是识别事物,识别结果表现在给待识别数据加上了标号。所以训练样本集必需由带标号样本组成。而非监督学****方法只有要分析数据集本身,预先没有什么标号。假如发觉数据集展现某种聚集性,则可按自然聚集性分类,但不以和某种预先分类标号对上号为目标。例图
1道路图像,有监督学****方法目标是找到“道路”,而非监督学****方法则只是将中间一条带状区域区分开来,本质上讲和“道路”这个标号没相关系。
3. 非监督学****方法在寻求数据集中规律性,这种规律性并不一定要达成划分数据集目标,也就是说不一定要“分类”。这一点是比有监督学****方法用途要广泛。譬如分析一堆数据主分量,或分析数据集有什么特点全部能够归于非监督学****方法范围。
4. 用非监督学****方法分析数据集主分量和用k-l变换计算数据集主分量又有区分。应该说后者从方法上讲不是一个学****方法。所以用k-l变换找主分量不属于非监督学****方法,即方法上不是。而经过学****逐步找到规律性这表现了学****方法这一点。在人工神经元网络中寻求主分量方法属于非监督学****方法。 以上四点是对非监督学****方法定义,及和有监督学****方法区分。
,其中左图是在图像中路面区和非路面中各找一个窗口,将其中每个象素分别作为这两类训练样本集,用这两个样本集在特征空间分布参数进行设计。而无监督学****方法则不一样,它不预先选择样本类别样本集,而是将整幅图像素全部作为待分类样本集,经过它们在特征空间中表现出来聚类现象,把不一样类别划分开。
,样本集分布展现交迭情况,而无监督学****方法因为没有类别样本指导,无法确定它们交迭情况,只能按分布聚类情况进行划分。在类似于该例实际应用问题中,预先选定不一样类别样本往往不可能,如时间不许可,或无法用人工干予等原因。另外在一些有监督学****方法中,也往往需要
利用聚类方法将样本按其分布划分成若干子类等。聚类方法就是无监督学****方法一个内容,它是常常应用一门技术。
图 无监督学****方法能够分成两大类,一类为基于概率密度函数估量直接方法,指设法找到各类别在特征空间分布参数再进行分类。另一类称为基于样本间相同性度量间接聚类方法,其原理是设法定出不一样类别关键或初始类核,然后依据样本和这些关键之间相同性度量将样本聚集成不一样类别。下面分别讨论这两种方法。
最常见基于概率密度估量直接方法例子是直方图方法。比如我们统计一所学校中学生身高分布就往往可采取直方图方法,把身高划分成一段段,如1米到1米75算一段,然后对每一段统计身高在此范围内学生数,得到直方图。假如这个学校男女学生数目相近,则我们就会发觉该直方图会表现出有两个分布高峰。那么找到