1 / 4
文档名称:

Siri的重大改进-为Siri引入机器学习技术.doc

格式:doc   大小:63KB   页数:4页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

Siri的重大改进-为Siri引入机器学习技术.doc

上传人:840122949 2018/11/14 文件大小:63 KB

下载得到文件列表

Siri的重大改进-为Siri引入机器学习技术.doc

文档介绍

文档介绍:Siri的重大改进:为Siri引入机器学****技术
Apple 的 Siri 可以说是最著名的语音助手之一,其中不必按按钮便能向 Siri 下指令的「Hey Siri」功能也受到许多好评,近日在博客中,Siri 团队除了表示计划运用机器学****持续改进这项功能,也解释了 iOs 设备的 Hey Siri 功能的运作方式,以及未来计划持续改进的目标。
所谓的「Hey Siri」功能,就是让使用者不必按按钮、只需在语音指令前加上 Hey Siri,手机便会自动启动并遵照指示行动。
但 Apple 究竟是怎么做到的?博客文章指出,「Hey Siri」的进化与解决了「关键片语检测」(key-phrase detection)问题相关,同时运用了 DNN 来进行了早期建模工作,并使用了递归神经网络(RNN)来进行多样化的训练与学****br/>
Siri 团队解释,之所以选择以「Hey Siri」作为触发语,是因为即使在这项功能推出以前,人们在运用按钮呼唤 Siri 也会自然而然的在请求前加上这句话。这原先是一个方便用户的简单决定,但早期的离线实验中,Hey Siri 的简洁和口语性却为开发团队带来额外的挑战。
Siri 团队主要面临的错误辨识挑战为三种,分别为当用户表达类似短句时、当非用户说出 Hey Siri 时,以及最令 Siri 团队头痛的当非用户说出类似短句时。
为了让 Siri 不被类似短句及非用户误导,团队先是将焦点由寻常语音辨识目标的「说话内容」转移至辨识「说话者」的身份,利用说话者辨识(speaker recognition, SR)并结合相关技术来增进侦测关键短句的系统质量。

以目前来说,Apple 会要求首次使用的用户以要求的 5 个短句来语音来完成说话者辨识系统的注册,但除了这种显性注册模式之外,团队也设计了另一种隐性模式(implicit enrol