1 / 52
文档名称:

相亲、交友与决策树.pptx

格式:pptx   大小:2,030KB   页数:52页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

相亲、交友与决策树.pptx

上传人:分享精品 2018/3/11 文件大小:1.98 MB

下载得到文件列表

相亲、交友与决策树.pptx

相关文档

文档介绍

文档介绍:决策树学****方法初探 ——一个初学者的视角
嘚儿个没
从我国的一个社会问题说起
这是一个
愁坏父亲母亲
捧红了江苏卫视
却乐坏了马云(和宝强)
的问题
从我国的一个社会问题说起
剩男剩女问题引爆的商机
双十一的购物狂欢
交友婚介网站/节目的盛行
于是……
尼玛希望能够帮助单身男女青年更好地选择交友对象
现状:尼玛已经收集了一些男同胞的资料
目标:为优秀的女性推荐与之匹配的男性
But How?
先看看现在相亲的基本的特征
从我国的一个社会问题说起
相亲的常见场景
有一些还没开始就失败了
有一些还是可能成功的
母亲:尼美,给你介绍个男朋友吧。
尼美:多大年纪了?
母亲:26。
尼美:长的怎么样?
母亲:挺帅的。
尼美:收入高不?
母亲:不算很高,中等情况。
尼美:是公务员不?
母亲:是,在税务局上班呢。
尼美:那好,我去见见。
决策树的基本思想
尼美(女,23岁,企业白领)是如何选择相亲对象的
尼美对对象的属性建模
<性别,长相,年龄,收入,职业>
尼美心中对对象筛选过程
性别:当然不能是女的
长相:要帅的
年龄:比自己大但小于30
收入:中等或以上
职业:收入中等则要稳定体面
尼美根据属性将男同胞们分类
见 or 不见
决策树的基本思想
尼玛分析了尼美相亲判断过程的基本组成
测试结点
表示某种作为判断条件的属性
分支
根据条件属性取值选取的路径
叶子
使判断终止的结论
尼美做选择时,其实用的是决策树
关键在于决策树如何构造
测试节点
分支
叶子
决策树的基本思想
尼玛得知尼美相亲决策树构造的基本思路
从一棵空决策树开始,选择某一属性作为分裂属性;
根据分裂属性的值的不同,可将训练样本分成若干子集;
如果该子集为空,或当前子集中的样本属于同一个类,则该子集为叶子结点;
否则继续以该子集作为测试结点,选择一个新的分类属性重复上述步骤对该子集进行划分,直至属性集为空或每个子集中的样本均属于同一各类。
决策树的最基本功能——分类
这个思路就是CLS算法
Hunt,Marin和Stone于1966年提出,决策树的雏形
尼玛交友推荐系统的构造和优化
尼玛决定开始构造自己的决策树
数据就是王道,尼玛公开了16组数据
序号
姓名
职业分类
职位评级
收入水平
有房有车
债务情况
评级
1
A
金融
A类

1

钻石男
2
B
IT
A类

3

经适男
3
C
行政
A类

2

经适男
4
D
司法
A类

0

钻石男
5
E
行政
B类

3

牛奋男
6
F
金融
B类

3

钻石男
7
G
IT
B类

2

牛奋男
8
H
司法
A类

2

经适男
9
J
行政
A类

0

经适男
10
K
教育
C类

3

牛奋男
11
L
司法
A类

3

钻石男
12
M
教育
C类

2

牛奋男
13
N
IT
B类

0

牛奋男
14
P
教育
A类

2

经适男
15
Q
教育
C类

2

经适男
16
R
IT
B类

2

牛奋男
尼玛交友推荐系统的构造和优化
尼玛构造的决策树
看上去像模像样
但是
两个绿圈里是什么鬼?
尼玛交友推荐系统的构造和优化
尼玛的导师愤怒了