1 / 8
文档名称:

如何修改基本决策树算法.doc

格式:doc   大小:144KB   页数:8页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

如何修改基本决策树算法.doc

上传人:iluyuw9 2017/2/20 文件大小:144 KB

下载得到文件列表

如何修改基本决策树算法.doc

文档介绍

文档介绍:a) 如何修改基本决策树算法, 以便考虑每个广义数据元组( 即每一行) 的 count ? b) 使用修改过的算法,构造给定数据的决策树。 c) 给定一个数据元组,它的属性 department ,age 和 salary 的值分别为“ systems ”,“26…30”,和“46K…50K ”。该元组 status 的朴素贝叶斯分类是什么? 1. 为给定的数据设计一个多层前馈神经网络。标记输入和输出层节点。 2. 使用上面得到的多层前馈神经网络, 给定训练实例( sales , senior , 31…35,46K …50K ),给出后向传播算法一次迭代后的权重值。指出你使用的初始权重和偏倚以及学****率。解答: (a) 如何修改基本决策树算法,以便考虑每个广义数据元组(即每一行) 的 count ? (b) 使用修改过的算法,构造给定数据的决策树。(c) 给定一个数据元组,它的属性 department , age 和 salary 的值分别为“ systems ”,“26…30”,和“46K…50K ”。该元组 status 的朴素贝叶斯分类是什么? 解一: 设元组的各个属性之间相互独立,所以先求每个属性的类条件概率: P(systems|junior)=(20+3)/(40+40+20+3+4+6)=23/113; P(26-30|junior)=(40+3+6)/113=49/113 ; P(46K-50K|junior)=(20+3)/113=23/113 ; ∵ X=(department=system,age=26 … 30,salary=46K … 50K) ; ∴ P(X|junior)=P(systems|junior)P(26-30|junior)P(46K-50K|junior) =23×49× 23/113 3 =25921/1442897= ; P(systems|senior)=(5+3)/(30+5+3+10+4)=23/52; P(26-30|senior)=(0)/53=0; P(46K-50K|senior)=(30+10)/52=40/52 ; ∵ X=(department=system,age=26 … 30,salary=46K … 50K) ; ∴ P(X|senior)=P(systems|senior)P(26-30|senior)P(46K-50K|senior)=0; ∵ P(junior)=113/165= ; ∵ P(senior)=52/165= ; ∴ P(X|junior)P(junior)= 6×=>0= 0=P(X|senior)P(senior) ; 所以:朴素贝叶斯分类器将 X分到 junior 类。解二: 设元组的各属性之间不独立,其联合概率不能写成份量相乘的形式。所以已知: X=(department=system,age=26 … 30,salary=46K … 50K) ,元组总数为: 30+40+40+20+5+3+3+10+4+4+6=165 。先验概率: 当 status=senior 时,元组总数为: 30+5+3+10+4=52 , P(senior)=52/165= ; 当 statu