文档介绍:模式识别导论
多媒体课件
齐敏
第1章绪论
第1章绪论
模式和模式识别的概念
模式识别系统
模式识别概况
模式识别的应用
2. 狭义定义
1)模式:对某些感兴趣的客体的定量的或结构的描述。模式类是具有某些共同特性的模式的集合。
2)模式识别:研究一种自动技术,依靠这种技术,计算机将自动地(或人尽量少地干涉)把待别识模式分配到各自的模式类中去。
1. 广义定义
1)模式(pattern):
一个客观事物的描述,一个可用来仿效的完善的例子。
2)模式识别(pattern recognition) :
按哲学的定义是一个“外部信息到达感觉器官,并被转换成有
意义的感觉经验”的过程。
例:识别热水、字迹等。
模式和模式识别的概念
注意:
狭义的“模式”概念——是对客体的描述,不论是待识别客体,还是已知的客体。
广义的“模式”概念——是指“用于效仿的完善例子”
1)目前的计算机建立在诺依曼体系基础之上。
1946年:美籍匈牙利数学家冯·诺依曼提出了关于计算机组成和工作方式的基本设想:数字计算机的数制采用二进制;计算机按照程序顺序执行,即“程序存储”的概念。
1949年:研制出第一台冯·诺依曼式计算机。
1956年:第一次人工智能(artificial intelligence)研讨会在美国召开。
3. 相关的计算机技术
2)第五代人工智能型计算机
本质区别:主要功能将从信息处理上升为知识处理(学习、联想、推理、解释问题),使计算机具有人类的某些智能。研制工作从80年代开始,目前尚未形成一致结论。
几种可能的发展方向:
神经网络计算机--模拟人的大脑思维。
生物计算机--运用生物工程技术、蛋白分子作芯片。
光计算机--用光作为信息载体,通过对光的处理来完成
对信息的处理。
4. 研究和发展模式识别的目的
提高计算机的感知能力,从而大大开拓计算机的应用。
模式识别系统
简例:建立感性认识
以癌细胞识别为例,了解机器识别的全过程。
1. 信息输入与数据获取
将显微细胞图像转换成数字化细胞图像,是计算机分析的原始数据基础。
数字化显微细胞图像
灰度图象
经过染色处理过的彩色图象
核N
浆C
背景B
灰度数字图像的像素值反映光密度的大小。
2. 数字化细胞图像的预处理与区域划分
预处理的目的:
(1)去除在数据获取时引入的噪声与干扰。
(2)去除所有夹杂在背景上的次要图像,突出主要的待识别
的细胞图像。
例:平滑、图像增强等数字图像处理技术。
区域划分的目的:
找出边界,划分出三个区域,为特征抽取做准备。
设灰度阈值为Tc和Tn,图像中某像素的灰度值为Ti,则:
Ti ≥ Tn的点属于胞核区;
Ti < Tc的点属于背景区;
Tc≤Ti< Tn的点属于胞浆区;
检测的边缘
Tn
Tc
疑似肿瘤细胞
Tc
Tn
核N
浆C
例:对一个细胞抽取33个特征,建立一个33维的空间X,每个细胞可通过一个33维随机向量表示,记为:
即把一个物理实体“细胞”变成了一个数学模型“33维随机
向量”,也即33维空间中的一点。
3. 细胞特征的抽取、选择和提取
目的:为了建立各种特征的数学模型,以用于分类。
①抽取特征:原始采集数据,第一手资料,特征数据量大。是特征选择和提取的依据。
②特征选择:在原始特征基础上选择一些主要特征作为判别用的特征。
③特征提取:采用某种变换技术,得出数目上比原来少的综合特征作为分类用,称为特征维数压缩,习惯上亦称特征提取。