1 / 3
文档名称:

基于决策树的分类算法.pdf

格式:pdf   大小:145KB   页数:3页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于决策树的分类算法.pdf

上传人:q1188830 2022/2/25 文件大小:145 KB

下载得到文件列表

基于决策树的分类算法.pdf

相关文档

文档介绍

文档介绍:基于决策树的分类算法
罗俊杰
(南京大学计算机科学与技术系 南京市 210093)
A Classification Algorithm based on Decision Tree
n0I n0 A n0 A n0I n0I n0 A n0 A
I gain =- log - log - log - log
n0 n0 n0 n0 n1 n1 n1 n1
决策树主要的算法有ID3[4],J48 ,都是不断的选择最优的属性,对数据集作划分,并
建立相应的节点,直到不能划分为止.
3. 本试验中的分类算法
在本试验中,使用辅助分析软件weka[2]对对象的五个视图分别用J48 决策树进行分析,并用 10-折交叉进
行评估检测,发现评估结果的总体准确率还不错,平均能达到 95%左右,当然这毕竟是对标记数据的度量,其准
确率可能高于正常情况下对未标记属性集的测量.
但是仔细分析可以得到,判断结果中对 non-ad 的准确率较高,个别视图甚至接近 100%,但是对 ad 判断的
准确率较低,一般能接近 90%.也就是说,有大量的 ad 属性被判断为 non-ad,而 non-ad 被判断为 ad 的情况较少.
从标记属性集的样本中可以看到,样本中 ad 属性的个数较少,大概为总体数据的 10%左右,也就是说如果所有
的样本都被判断为 non-ad,那总体的分类正确率也可以达到 90%.而在实际情况中这样的分类准确率其实是
没有什么实用价值的.
我们对其中一个视图由 weka 产生的 J48 决策树进行具体分析.

图 1
由上图可以得到,由产生的 J48 决策树在对样本进行判断时将9个ad属性判断为non-ad 属性,而没有
将 non-ad 属性判断为 ad
,我们应该在提高总体分类正确率的基础上尽量提高

最近更新

2024年山东水利职业学院单招职业适应性测试题.. 58页

脑卒中康复中的碧儿她的坚强与勇气 22页

2024年山西省忻州市选调生考试(公共基础知识.. 146页

2024年广西百色凌云县乡镇事业单位公开招聘工.. 89页

2024年广西百色市机关事务管理局直属单位招聘.. 89页

2024年广西贺州市昭平县机关事业单位招聘16人.. 89页

2024年德州科技职业学院单招职业适应性测试题.. 57页

2024年江苏海事职业技术学院单招职业适应性测.. 57页

2024年江苏省淮阴市行政职业能力测验题库含答.. 149页

2024年江西省赣州市行政职业能力测验题库及一.. 151页

2024年河南应用技术职业学院单招职业适应性测.. 58页

2024年浙江省温州市行政职业能力测验题库各版.. 148页

2024年湖北艺术职业学院单招职业适应性测试题.. 58页

2024年皖西卫生职业学院单招职业适应性测试题.. 59页

2024年辽宁工程职业学院单招职业适应性测试题.. 56页

2024年辽宁省盘锦市行政职业能力测验题库(满.. 146页

2024年辽宁省鞍山市行政职业能力测验题库(模.. 150页

云南省曲靖市选调生考试(行政职业能力测验).. 149页

公共基础知识内蒙古锡林郭勒盟选调生考试(行.. 148页

公共基础知识山东省泰安市选调生考试(行政职.. 148页

公共基础知识江苏省镇江市选调生考试(行政职.. 149页

公共基础知识辽宁省大连市选调生考试(行政职.. 148页

公共基础知识陕西省宝鸡市选调生考试(行政职.. 147页

吉林省松原市事业单位招聘考试(职业能力倾向.. 148页

国网2024年高校毕业生招聘华北分部招聘10人历.. 59页

安徽省六安市事业单位招聘考试(职业能力倾向.. 148页

安徽省淮南市事业单位招聘考试(职业能力倾向.. 147页

山东医学科学院2024年招聘工作人员历年高频难.. 59页

物业人员培训方案 25页

物业绿化管理方案 14页