1 / 10

文档名称：

(六)K近邻.pptx

格式：pptx 大小：285KB 页数：10页

下载后只包含 1 个 PPTX 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

分享

预览

下载此文档

(六)K近邻.pptx

上传人:分享精品 2017/11/16 文件大小：285 KB

下载得到文件列表

(六)K近邻.pptx

相关文档

文档介绍

文档介绍：数据挖掘方法六K-Nearest NeighborK最近邻分类
原理
K最近邻(k-Nearest Neighbor,KNN)算法,是一个理论上比较成熟的分类方法。
该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。
KNN算法的指导思想是“近朱者赤,近墨者黑”,由你的邻居来推断出你的类别。
计算步骤如下:
1)算距离:给定测试对象,计算它与训练集中的每个对象的距离
2)找邻居:圈定距离最近的k个训练对象,作为测试对象的近邻
3)做分类:根据这k个近邻归属的主要类别,来对测试对象分类
距离衡量常用的是欧式距离(Euclidean distance):二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离为
d = sqrt((x1-x2)^2+(y1-y2)^2)
KNN的算法过程是是这样的:
从右图中我们可以看到,图中的数据集是良好的数据,即都打好了label,一类是蓝色的正方形,一类是红色的三角形,那个绿色的圆形是我们待分类的数据。
如果K=3,那么离绿色点最近的有2个红色三角形和1个蓝色的正方形,这3个点投票,于是绿色的这个待分类点属于红色的三角形。
如果K=5,那么离绿色点最近的有2个红色三角形和3个蓝色的正方形,这5个点投票,于是绿色的这个待分类点属于蓝色的正方形。
我们可以看到,KNN本质是基于一种数据统计的方法
举例一
表中显示了6部已知电影中出现的打斗镜头次数及接吻镜头次数,及电影所属的类型。下面将计算每部已知电影与未知电影的距离(本例中采用欧式距离)
我们得到了样本集中所有电影与未知电影的距离,按照距离递增排序,可以找到k个距离最近的电影。假定k=3,三个最靠近的电影依次是He's Not Really into Dudes、Beautiful Woman、California Man。从K-近邻算法按照距离最近的三部电影的类型,决定未知电影的类型,而这三部电影全是爱情片,因此我们判定未知电影是爱情片。
sqrt[(18-3)^2+(90-104)^2]=
sqrt(421)=
举例二:iris鸢尾花
150朵花的属性
4个定量变量:

1个定性变量:Species花的种类,[山鸢尾(setosa) 蓝旗鸢尾(versicolor) 维珍尼亚鸢尾(virginica)]
本例中用4个定量变量把150朵花分为3类,定性变量为分类。
(123)
> training=sample(1:150,145)
> test=(1:150)[-training]
> test
Species
88 versicolor
103 virginica
104 virginica
106 virginica
123 virginica

相关标签

k近邻算法 k最近邻算法安全违章心得体会体育生心得体会党性修养学习体会采摘心得体会根鸟心得体会洗脚心得体会意味深长值得仔细体会交通违法心得体会

最近更新

急性脑梗塞的责任血管判定 50页

移动早餐车商业计划书 6页

夜摊服装创业计划书 6页

建筑装饰用全维铝芯复合板 7页

空调清洗保养方案 2页

留任履约激励方案 3页

企业演讲与展示的专业平台 25页

美术机构定制口罩方案 2页

城市绿化项目物资运输样本 7页

城市改造渣土清运合同规定 7页

垃圾焚烧发电原料运输合同 8页

互联网+高科技+大数据模板 25页

就业促进行动方案 2页

中国风模板第一章 22页

学校保证书格式常用范文(标准版) 3页

婚内协议书格式(标准版) 4页

委托代理合同经典版样板 4页

天水市销售目标责任书(标准版) 6页

基础设施工程承揽合同样式(标准版) 4页

土木工程学生实习保证书范本(标准版) 3页

土地承包管理合同范本2篇新(标准版) 13页

国际商标许可合同样本(标准版) 13页

商铺租赁合同精简版样式 3页

商品代销合同(示范文本)(标准版) 5页

员工入股协议书范本格式(标准版) 4页

合作拍摄电影合同书简单版范文 9页

专业的商业项目计划书模板 36页

贵州省认可期刊目录 5页

小学数学六年级简便计算练习题 7页

宣传单制作服务合同 9页

猜你喜欢

煤催化气化技术或成煤化工发展新思路 3页

会展中心翻新改造施工合同 7页

热冲压钢镀层技术的研究现状 3页

烟叶中硒含量测定及价态分析 3页

灵水岩溶泉的水质水量变化及原因分析 3页

平衡系数检测技术研讨 69页

仓储物流融资居间合同范例 7页

仓储物流合同法律问题解析 7页

漆器工艺技术资料简要 3页

人工智能监理居间合同 7页

溶剂浸渍树脂稳定化研究进展 3页

亲子乐园装修垫资协议 6页

渣油气化炉冷态流场研究(Ⅰ) 3页

清水冲刷粗化层极限冲深试验研究 3页

产业升级园区规划 7页