1 / 11
文档名称:

人工智能演讲人机互动siri课件.ppt

格式:ppt   大小:802KB   页数:11页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

人工智能演讲人机互动siri课件.ppt

上传人:yzhqw888 2022/10/2 文件大小:802 KB

下载得到文件列表

人工智能演讲人机互动siri课件.ppt

文档介绍

文档介绍:该【人工智能演讲人机互动siri课件 】是由【yzhqw888】上传分享,文档一共【11】页,该文档可以免费在线阅读,需要了解更多关于【人工智能演讲人机互动siri课件 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。人工智能应用 -----人机交互siri
人机交互的概念
人机交互、人机互动(英文:Human–ComputerInteraction[1]或Human–MachineInteraction,简称HCI或HMI),是一门研究系统与用户之间的互动关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。
Siri是苹果公司在其产品iphone4S上应用的一项语音控制功能。Siri可以令iPhone4S变身为一台智能化机器人,利用Siri用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。Siri可以支持自然语言输入,并且可以调用系统自带的天气预报、日程安排、搜索资料等应用。还能够不断学****新的声音和语调,提供对话式的应
siri最大的特色,则是人机的互动方面,不仅有十分生动的对话接口,其针对用户询问所给予的回答,也不至于答非所问,有时候更是让人有种心有灵犀的惊喜,例如使用者如果在说出、输入的内容包括了『drunk』、『home』这些字(甚至不需要符合语法,相当人性化...),Siri则会判断为喝醉酒、要回家,并自动建议是否要帮忙叫出租车。
人机交互的界面
人机界面MMI:Man–MachineInterface或人机互动界面(Human–ComputerInterface或Human–MachineInterface)大量运用在工业与商业上,简单的区分为“输入”(Input)与“输出”(Output)两种,输入指的是由人来进行机械或设备的操作,如把手、开关、门、指令(命令)的下达或保养维护等,而输出指的是由机械或设备发出来的通知,如故障、警告、操作说明提示等,好的人机接口会帮助使用者更简单、更正确、更迅速的操作机械,也能使机械发挥最大的效能并延长使用寿命,而目前市面上所指的人机接口则多界狭义的指在软件人性化的操作接口上。
Siri的输入系统支持多模态输入,即不仅仅支持众所周知的语音识别,也允许用户进行文本输入、GUI界面操作以及事件触发等。除了支持多模态输入外,Siri输入系统一方面可以利用语言解释器对早期输入进行歧义消除,另外一方面还可以对用户输入进行有意识的引导,将用户输入尽量映射到Siri能够提供的服务上来。这样对于用户和Siri来说才可相得益彰,Siri可体现其价值,用户可获得帮助。
其实以电脑而言,电脑互动主要意义是以使用者为考量,而不是从设计者的“概念模型”(ConceptualModels)去切入,如何让使用者能控制系统的顺序、速度,怎么注意资讯,都是人机互动中所关心的。人机互动的关键在于使用者了解了电脑能替我们做些什么,及如何处理资讯,我们就可将大部份时间放在“人”的身上,而不是技术领域,所以一个成功的互动系指人们告诉电脑如何去工作,而不是在技术上打转。[3]
电脑界面的设计不光是单向的,而是设计者必须重视使用者的回馈(feedback),并且进行调整,运用适当的设计,比如美工图案选单或是简易的操作,让使用者可以轻松的满足自己的需求,有效率的执行工作,才能让机器发挥最大的功能。[3]
概念模型
设计者或其他相关工程人员,所共同设计的操作接口称为概念模型。使用者并无法直接与“设计者”(Designer)进行对话,也鲜少透过说明书准确而有效地了解设计者的概念;透过与“接口”(Interface)的互动,进而对该设计产品的功能及操作所形成的了解,则称为使用者对于该产品所形成的“心智模型”(UserMentalModel)。一般而言,使用者的心智模型是在使用中自然逐步形成的,同时,借由与“系统”(System)不断地互动,使用者会不断修正其心智模型。如果到了最后,使用者的心智模型与设计师的概念模型能一致或相当接近,那么,接口设计就算是相当成功了。[4]
概念模型可分为依据“活动”(Activities)所设计或“物件”(Object)所设计的两种导向。想要设计出具有“使用性”(Usability)的接口,必须要了解活动的类型,以及人们在目前的工具中发生了什么问题。[5]
活动行概念模型
根据活动所设计的概念模型可分为四类:
指令型(Instructing)一个指令一个动作,简单有效率,例如DOS操作系统及word。
对话型(Conversing)系统与使用者进行对话,双向互动,但容易发生系统误解使用者的状况,或是造成电话语音系统单向互动的问题。
操作导航型(Manipulating&Navigating)让使用者用最自然的直觉去操作接口,如苹果开创的图形化操作系统,还有电脑辅助设计系统都属此类型的设计。
搜寻浏览型(Exploring&Browsing)使用者依此系统搜寻资讯,如google等搜寻引擎及入口网站。[5]
物件型概念模型
面向对象的概念模型将重点放在处于某些特定背景情境下使用的特定物件,它往往与其在现实生活中的原型极为类似。[
Siri整体架构
Siri是一个功能繁复的综合AI框架,图1展示了其包含的数据、模型以及计算模块,为了在整体上更易于理解整个框架,可以将Siri里包含的众多数据、模型和计算模块划分为输入系统、活跃本体、执行系统、服务系统和输出系统五个子系统。其在解析用户输入时候遵循一定的执行顺序,以此来理解用户的真正意图并提供有用服务。
搜索方面的技术
1、以Google为代表的网页搜索技术;2、以WolframAlpha为代表的知识搜索技术(或者知识计算技术);3、以Wikipedia为代表的知识库(和WolframAlpha不同的是,这些知识来自人类的手工编辑)技术(包括其他百科,如电影百科等);4、以Yelp为代表的问答以及推荐技术。