文档介绍:第9章机器学习
符号学习
神经网络学习
知识发现与数据挖掘
遗传算法
符号学习
首先,我们指出,机器学习(这里指符号学习)是靠学习程序(或称为学习系统)实现的。学习程序的输入是数据、事实等各种各样的信息,输出则是知识,即概念、规则(规律)等。而且所学到的知识一般要存入知识库。
符号学习又可以分为不同的类型。通常是按学习策略、知识表示和应用领域等进行分类的。学习策略是学习中使用的推理方法。学习策略是按照学习程序对提供的信息所做的推理数量的多少来区分的。一种极端情况是没有任何推理功能,要增加系统知识时就得靠外界环境作大量的输入新知识的工作;另一种极端情况则是学习程序有相当数量的推理,可以根据试验和观察,推导出有组织的知识,这样系统就可能独立地发现新理论或发明新概念。介于这两者之间就是学习程序有一定的推理能力,能适应减轻外界环境负担的各种折衷情况。
遗传算法(ic Algorithm)是一种优化算法,它模拟了生物繁衍的遗传、变异和生物进化的自然选择过程。分类器系统是一种依靠信息传递的高度并行的规则库系统,它通过信任分配和规则发现进行学习。分类器系统运用遗传算法,把每一物种的个体对应于一个概念描述的变形,通过一个目标函数来确定哪些概念及其变化可保留在基因库中。
记忆学硬背学习或机械学习。这种学习方法不要求系统具有对复杂问题求解的能力,也就是没有推理技能,系统的学录问题有关的信息,然后检索并利用这些存储的信息来解决问题。
机械学忆和检索的办法,学习方法很简单,但学习系统需要几种能力。 
(1) 能实现有组织的存储信息。
(2) 能进行信息综合。
(3) 能控制检索方向。
传授学习
传授学习即通过对计算机指点教授的学习方法。具体来讲就是通过人机对话,把用户一般性意见或建议具体化,或者协助用户补充和修改原有的知识库。例如FOO程序(1981年开发)是玩扑克牌的一种游戏,称为“红心牌游戏”,可以告诉系统游戏的规则以及若干取胜的建议,如“避免取点”,“如果某个对手已无某种花色的牌,则不要先出该花色的大牌”,“如某个对手有黑桃Q,就设法把它攻出来”等等。
演绎学习
演绎学习是基于演绎推理的一种学习。演绎推理是一种保真变换,即若前提真则推出的结论也为真。在演绎学习中,学习系统由给定的知识进行演绎的保真推理,并存储有用的结论。例如,当系统能证明A→B且B→C,则可得到规则A→C,那么以后再要求证C,就不必再通过规则A→B和B→C去证明,而直接应用规则A→C即可。演绎学习包括知识改造、知识编译、产生宏操作、保持等价的操作和其他保真变换。演绎学习近几年才作为独立的学习策略。
类比学习
这是基于类比推理的一种学习方法。例如,学生在做练习时,往往在例题和习题之间进行对比,企图发现相似之处,然后利用这种相似关系解决习题中的问题。类比学习就是寻找和利用事物间的可类比的关系,从已有的知识推导出未知的知识。类比学习的过程包括以下主要步骤:
(1)回忆与联想即当遇到新情况或新问题时,先通过回忆与联想,找出与之相似的已经解决了的有关问题,以获得有关知识;
(2)建立对应关系即建立相似问题知识和求解问题之间的对应关系,以获得求解问题的知识;
(3)验证与归纳即检验所获知识的有效性,如发现有错,就重复上述步骤进行修正,直到获得正确的知识。