文档介绍:第6章神经网络控制
教学内容
首先介绍人工神经网络的基本概念和 ANN 的特性,以及神经网络的学习方法。然后讲授典型的前向神经网
络、反馈神经网络的原理、结构、基本算法,给出了 BP 网络的算法改进。最后介绍了神经网络 PID 控制。
教学重点
1. 神经网络的各种学习算法,神经网络的训练。
2. 感知器网络、BP 网络的结构和算法、BP 网络学习算法的改进,反馈网络的结构、学习算法。
3. 神经网络 PID 控制。
教学难点
神经网络的各种学习算法以及神经网络 PID 控制。
教学要求
。
Hebb 学习规则、有监督的学习规则或 Widow-Hoff 学习规则、有监督 Hebb 学习规则。
、反馈神经网络的原理、结构、基本算法。
BP 网络的算法改进。
PID 控制。
概述
基于人工神经网络的控制(ANN—based Control)简称神经控制(Neural Control)。神经网络是由大量人工
神经元(处理单元)广泛互联而成的网络,它是在现代神经生物学和认识科学对人类信息处理研究的基础上提出
来的,具有很强的自适应性和学习能力、非线性映射能力、鲁棒性和容错能力。充分地将这些神经网络特性应用
于控制领域,可使控制系统的智能化向前迈进一大步。
随着被控系统越来越复杂,人们对控制系统的要求越来越高,特别是要求控制系统能适应不确定性、时变的
对象与环境。传统的基于精确模型的控制方法难以适应要求,现在关于控制的概念也已更加广泛,它要求包括一
些决策、规划以及学习功能。神经网络由于具有上述优点而越来越受到人们的重视。
本节将介绍人工神经网络的基本概念和 ANN 的特性,以及神经网络的学习方法。
生物神经元模型
人脑大约包含 1012 个神经元,分成约 1000 种类型,每个神经元大约与 102~104 个其他神经元相连接,形成
极为错综复杂而又灵活多变的神经网络。每个神经元虽然都十分简单,但是如此大量的神经元之间、如此复杂的
连接却可以演化出丰富多彩的行为方式。同时,如此大量的神经元与外部感受器之间的多种多样的连接方式也蕴
含了变化莫测的反应方式。
一个神经元结构的模型示意图如图所示。
由图看出,神经元由胞体、树突和轴突构成。胞体是神经元的代谢中心,它本身又由细胞核、内质网和高尔
基体组成。内质网是合成膜和蛋白质的基础,高尔基体主要作用是加工合成物及分泌糖类物质,胞体一般生长有
许多树状突起,称为树突,它是神经元的主要接受器。胞体还延伸出一条管状纤维组织,称为轴突。轴突外面可
能包有一层厚的绝缘组织,称为髓鞘(梅林鞘),髋鞘规则地分为许多短段,段与段之间的部位称为郎飞节(Ranvier
节)。
轴突的作用主要是传导信息,传导的方向是由轴突的起点传向末端。通常,轴突的末端分出许多末梢,它们
同后一个神经元的树突构成一种称为突触的机构。其中,前一个神经元的轴突末梢称为突触的前膜,后一个神经
元的树突称为突触的后膜;前膜和后膜两者之间的窄缝空间称为突触的间隙,前一个神经元的信息由其轴突传到
末梢之后,通过突触对后面各个神经元产生影响。
从生物控制论的观点来看,神经元作为控制和信息处理的基本单元,具有下列一些重要的功能与特性:
1. 时空整合功能
神经元对于不同时间通过同一突触传入的神经冲动,具有时间整合功能;对于同一时间通过不同突触传人的
神经冲动,具有空间整合功能。两种功能相互结合,具有时空整合的输入信息处理功能,所谓整合是指抑制和兴
奋的受体电位或突触电位的代数和。
2. 兴奋与抑制状态
神经元具有两种常规工作状态:兴奋——当传人冲动的时空整合结果,使细胞膜电位升高,超过被称为动作
电位的阈值(约为 40mV)时,细胞进人兴奋状态,产生神经冲动,由轴突输出;抑制——当传人冲动的时空整
合结果,使膜电位下降至低于动作电位的阈值时,细胞进人抑制状态,无神经冲动输出,满足“0-1”律,即“兴
奋、抑制”状态。
3. 脉冲与电位转换
突触界面具有脉冲/电位信号转换功能。沿神经纤维传递的电脉冲为等幅、恒宽、编码(60~100mV)的离
散脉冲信号,而细胞膜电位变化为连续的电位信号。在突触接口处进行“数/模”转换,是通过神经介质以量子
化学方式实现(电脉冲—神经化物质—膜电位)的变换过程。
4. 神经纤维传导速度
神经冲动沿神经传导的速度在 1~150 m/s 之间,因纤维的粗细、髓鞘的有无而有所不同:有髓鞘的粗纤维,
其传导速度在 100