1 / 56
文档名称:

680-统计自然语言处理基础.ppt

格式:ppt   页数:56
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

680-统计自然语言处理基础.ppt

上传人:小玉儿 2012/2/5 文件大小:0 KB

下载得到文件列表

680-统计自然语言处理基础.ppt

文档介绍

文档介绍:统计自然语言处理基础
第14章聚类
王建华
2007-09-07
1
提纲
聚类概述
用途
种类
“软”聚类,”硬”聚类
层级聚类
单连通、全连通
平均连通
自顶向下聚类
非层级聚类
K平均算法
EM算法
2
提纲
聚类概述
用途
种类
“软”聚类,”硬”聚类
层级聚类
单连通、全连通
平均连通
自顶向下聚类
非层级聚类
K平均算法
EM算法
3
聚类概述
聚类算法的目标:
是将一组对象划分成若干组或类别,简单地说就是相似元素同组、相异元素不同组的划分过程。
定义:
聚类是一个无指导的学习过程,它是指根据样本之间的某种距离在无监督条件下的聚簇过程。
4
5
聚类概述
用途:
在统计自然语言处理中,聚类算法有两个重要的用途:


6
聚类概述
用途:

当我们面临一个新问题,并且希望建立一个概率模型或者仅仅是为了理解现象的基本特性时,这是一个首要步骤。
对于不懂英语的人也能通过下面的聚类树图对英文的词性有大致的了解。
7
8
聚类概述
用途:

以法英翻译为例,Friday前的介词未知,进行推断。
已有的英文数据:on Sunday, on Monday, on Thursday.
按照语法和语义聚类,Sunday, Monday, Thursday就会被聚到一类,因为它们有相同的上下文模式。
Until day-of-the-week, last day-of-the-week, day-of-the-week morning
同类中的元素具有互换性,因此可以推断on Friday的正确性。
9
聚类概述
聚类算法与分类算法的区别:
分类算法是一个有监督的学习过程,它需要对标注数据集合进行训练;
聚类算法则不需要”教师”的指导,不需要提供训练数据,倾向于数据的自然划分,因此被称为无监督的学习或者自动学习.
10

最近更新

2026年江西生物科技职业学院单招职业倾向性考.. 42页

2026年江西省九江市单招职业倾向性测试模拟测.. 41页

2025年邵阳职业技术学院单招职业技能考试模拟.. 39页

2025年郑州亚欧交通职业学院中单招职业适应性.. 39页

2026年江西科技学院单招职业倾向性考试题库必.. 42页

2025年郑州信息科技职业学院单招职业倾向性考.. 40页

2026年沈阳单招院校试题附答案 41页

2025年郑州工业应用技术学院单招职业适应性测.. 42页

2026年河北东方学院单招职业适应性测试题库附.. 41页

2026年河北化工医药职业技术学院单招职业倾向.. 43页

2025年郑州汽车工程职业学院单招职业适应性测.. 40页

2025年郑州电力职业技术学院单招职业倾向性考.. 40页

2025年郑州职业技术学院单招职业适应性考试模.. 40页

2026年河北省衡水市单招职业倾向性考试模拟测.. 42页

2025年郑州轨道工程职业学院单招职业技能测试.. 41页

2026年河北能源职业技术学院单招职业技能考试.. 41页

2025年鄂州职业大学单招职业倾向性测试模拟测.. 40页

2025年酒泉职业技术学院单招职业技能测试题库.. 41页

2025年重庆三峡职业学院单招综合素质考试题库.. 41页

2025年重庆五一职业技术学院单招职业倾向性考.. 41页

2025年重庆人文科技学院单招职业适应性测试题.. 41页

2025年重庆信息技术职业学院单招综合素质考试.. 40页

2025年重庆公共运输职业学院单招职业倾向性测.. 39页

【人教版英语字帖】七年级下册单词表衡水体字.. 42页

国开《建筑力学》期末机考答案 15页

农村人才流失国外研究报告 2页

住院患者自带药品使用管理规定通知 3页

栏杆计算书 2页

黄酒评分、扣分标准表(共1页) 1页

曾仕强易经六十四卦解 68页