1 / 20
文档名称:

第五章 非监督学习法.ppt

格式:ppt   大小:1,399KB   页数:20页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

第五章 非监督学习法.ppt

上传人:文库新人 2021/11/12 文件大小:1.37 MB

下载得到文件列表

第五章 非监督学习法.ppt

相关文档

文档介绍

文档介绍:第五章 非监督学****法
*
中国矿业大学 计算机科学与技术学院
(20)*
第一页,共20页
*
中国矿业大学 计算机科学与技术学院
(20)*
将数据按它们表现出的共性进行划分有两种基本方法,从大体上去把握这种不同方法的特点。
在实用中C均值算法等为代表的动态聚类方法,以及分级聚类方法是常用的方法,要重点掌握。
学****中要掌握从易而难的学****方法,如对数据相似度的度主方法最容易的是欧氏距离,然后再扩展到种种非欧氏距离的方法。
第二页,共20页
*
中国矿业大学 计算机科学与技术学院
(20)*
本章重点
1、什么叫非监督学****方法,什么叫有监督学****方法?
2、非监督学****方法主要的用途。
3、非监督学****方法的两种基本处理方法:按分布密集程度划分,与按相似度聚类划分。
4、按分布密度程度划分的基本方法。
5、动态聚类方法与分级聚类方法的概念。
6、典型的动态聚类方法C-均值算法与ISODATA算法。
7、使用非欧氏距离计算相似度的动态聚类方法。
8、分级聚类方法。
第三页,共20页
*
中国矿业大学 计算机科学与技术学院
(20)*
1、非监督学****方法与监督学****方法概念的区别。
2、按分布密集程度划分的基本方法。
本章难点
3、动态聚类方法——迭代修正的概念。
4、分级聚类方法。
第四页,共20页
*
中国矿业大学 计算机科学与技术学院
(20)*
1、掌握非监督学****方法的概念、用途。
本章学****目标
2、了解非监督学****方法对数据划分有两种基本方法。
3、掌握以c-均值算法,ISODATA算法为代表的动态聚类方法。
第五页,共20页
*
中国矿业大学 计算机科学与技术学院
(20)*
1、如果给机器一维数据,机器能自动地找出其中存在的规律吗?
2、有人把非监督学****方法叫无教师的学****而把第二章、第三章讨论的内容成为有监督学****又称有教师的学****你知道谁是教师吗?教师的作用体现在哪里?
课前思考题
3、机器能总结数据中存在的哪些规律呢?
第六页,共20页
*
中国矿业大学 计算机科学与技术学院
(20)*
4、机器能总结天气变化的规律,给出天气预报吗?
5、机器能炒股吗?
6、非监督学****方法与数据有关系吗?
第七页,共20页
*
中国矿业大学 计算机科学与技术学院
(20)*
§ 引言
有监督的学****方法
无监督的学****方法
人们日常生活中经常要观察事物与分析事物,从中寻找其规律性,这就是非监督学****方法要解决的问题。
第八页,共20页
*
中国矿业大学 计算机科学与技术学院
(20)*
第九页,共20页
*
中国矿业大学 计算机科学与技术学院
(20)*
非监督学****与有监督学****方法的以下几种不同点:
1、有监督学****方法必须要有训练集与测试样本。
而非监督学****没有训练集这一说,只有一组数据,在该组数据集内寻找规律。
2、有监督学****方法的目的就是识别事物,识别的结果表现在给待识别数据加上了标号。
而非监督学****方法只有要分析的数据集本身,预先没有什么标号。
第十页,共20页