文档介绍:机器学习方法及应用浅议
计算机软件与理论2009级 曹文学20091319
1、机器学习
学习是生物中枢神经系统的高级整合技能之一,是人类获取知识的重要途径和人类智能 的重要标志,按照人工智能大师H • Simon的观点切:学习就是系统在不断重复的工作中对本 身能力的增强或改进,使得系统在下一次执行同样或相类似的任务时,会比原来做得更好或 效率更高。
机器学习则是计算机获取知识的重要途径和人工智能的重要标志,是一门研究怎样用计 算机来模拟或实现人类学习活动的学科,是研究如何使机器通过识别和利用现有知识来获取 新知识和新技能。一般认为,机器学习是一个有特定目的的知识获取过程,其内部表现为从未 知到已知这样一个知识增长过程,其外部表现为系统的某些性能和适应性的改善,使得系统 能完成原来不能完成或更好地完成原来可以完成的任务。它既注重知识本身的增加,也注重 获取知识的技能的提高。
以H • Simon的学习定义作为出发点,建立如图1的基本模型。在机器学习的过程中,首 要的因素是外部环境向系统提供信息的质量。外部环境是以某种形式表达的外界信息集合, 它代表外界信息来源;学习是将外界信息加工为知识的过程,先从环境获取外部信息,然后对 这些信息加工形成知识,并把这些知识放入知识库中;知识库中存放指导执行部分动作的一 般原则,由于环境向学习系统提供的信息形形色色,信息质量的优劣直接影响到学习部分容 易实现还是杂乱无章。而知识库则是影响学习系统设计的第二个因素,由于知识库可能不同, 表达方式各有特点,在选择表示方式上要兼顾表达能力强、易于推理、易于完善及扩展知识 表示等几个方面的要求。执行环节是利用知识库中的知识完成某种任务的过程,并把完成任 务过程中所获得的一些信息反馈给学习环节,以指导进一步的学习。
图1机器学习的基本模型
机器学习是人工智能研究较为年轻的分支,它的发展过程大体上分为四个时期凹。
第一阶段是20世纪50年代中叶到60年代中叶,属于热烈时期。在这个时期,所研究的 是“没有知识”的学习,即“无知”学习。其研究目标是各类自组织系统和自适应系统,其主 要研究方法是不断修改系统的控制参数和改进系统的执行能力,不涉及与具体任务有关的知 识。本阶段的代表性工作是:塞缪尔(Samue 1)的下棋程序。但这种学习的结果远不能满足人 们对机器学习系统的期望。
第二阶段是在60年代中叶到70年代中叶,被称为机器学习的冷静时期。本阶段的研究 目标是模拟人类的概念学习过程,并采用逻辑结构或图结构作为机器内部描述。本阶段的代 表性工作有温斯顿(Winston)的结构学习系统和海斯罗思(Hayes-Roth)等的基本逻辑的归纳 学习系统。
第三阶段从20世纪70年代中叶到80年代中叶,称为复兴时期。在此期间,人们从学习 单个概念扩展到学习多个概念,探索不同的学习策略和方法,且在本阶段已开始把学习系统 与各种应用结合起来,并取得很大的成功,促进机器学习的发展。
1980年,在美国的卡内基一 梅隆(CMU)召开了第一届机器学习国际研讨会,标志着机器学习研究已在全世界兴起。
当前机器学习围绕三个主要研究方向进行:
面向任务:在预定的一些任务中,分析和开发学,这