文档介绍:动口不动手 Siri技术大起底
流言 在斯堪的纳维亚,Siri是Sigrid的另外一种写法,常用于婴儿或成年女性的昵称或名字,相当于英语中的Annie。2011年秋天之前,Siri几乎无人知晓,而在iPhone 4S内置的语音助动口不动手 Siri技术大起底
流言 在斯堪的纳维亚,Siri是Sigrid的另外一种写法,常用于婴儿或成年女性的昵称或名字,相当于英语中的Annie。2011年秋天之前,Siri几乎无人知晓,而在iPhone 4S内置的语音助手以此为名后,这个名字现在已炙手可热。以人名来命名,似乎在暗示着用户,她不仅仅是一项智能语音系统,更是你的贴身朋友。
被神话的Siri
网上流传着许多调侃Siri的段子。比如用户说:“我累了。”Siri则答:“听我的,立刻放下iPhone去打个盹,我就在这儿等你。”多么体贴人。再比如用户问:“你喜欢跟我在一起吗?”Siri则答:“我还是不说比较好。”机智而幽默。大量这类调侃的段子,把Siri的智能给神话了,似乎它无所不知无所不懂。
一般人对人工智能的发展抱有过高的期待,但实际上现在的不少人工智能产品,从某种意义上来说就是一个骗局(Jeff)。大部分所谓的人工智能产品,其实就是人工预先编制好的脚本而已,只不过脚本编得很巧妙,将可能遇到的各种答案都收罗进去(与单机游戏中的NPC对话时就是这样)。或者有一个大规模的数据库(类似谷歌的搜索建议),有的可能会涉及到一些混乱笨拙的模糊决策、神经网络和遗传算法系统,但这些“人工智能”程序功能非常有限,不可能帮助我们完成日常工作。
所以,在Siri官方网站上,苹果宣传(承诺)Siri所能做的,无非就是增加提醒、发送短信、询问天气、查信息、发邮件等等。这些功能实际是不开放的,只是针对手机和网络的操作。总之,Siri没那么神,它并不能理解所有东西,各种貌似智能化的Siri调侃,只不过是娱乐罢了。
Siri技术的台前幕后
Siri就像iPhone手机中内嵌的一个声控软件,它让我们不用手操作,只需用嘴对着手机发布命令,就可以完成搜寻资料、查询天气、设定手机日历、设定闹铃等诸多服务。
虽然真正意义上的智能产品还没有出现,但是与同类产品相比,Siri的智能化算是相当高的了,它能在一定程度上理解用户所说的话、所发布的命令。不要小看这点,iPhone上千万的用户,各人有不同的语音,各人的命令用语也不尽相同,要想正确理解并执行,决非易事。那么Siri是怎么做到的呢?
从操作流程看,Siri可分为三大部分:,这些语音被录制并压缩;;,理解用户真正的意图,并选择最匹配的服务(如搜索、地图等)返回给用户。
如果从程序员的角度来看,Siri技术包含了三大层面:语音到文本分析器、语法分析器及服务提供者。Siri的技术框架可以划分为5个子系统,各系统各司其职,遵循着一定的执行顺序,以此来理解用户的真正意图并提供有用服务。
Siri支持多模态输入,除去众所周知的语音输入,同时也支持用户文本输入、GUI界面触控操作等。
这里可理解为Siri整