文档介绍:搜狗AI:不入“红海”入“蓝海”
姜姝姝
AI (人工智能)的“黄金时代”已来!那离我们最近的AI是什么呢?地图里的语 音入口,机器翻译、拍照识图、无人超市,还是最近大热的智能音箱,比如正式 开售的可语音购物的天猫精灵。但这搜狗AI:不入“红海”入“蓝海”
姜姝姝
AI (人工智能)的“黄金时代”已来!那离我们最近的AI是什么呢?地图里的语 音入口,机器翻译、拍照识图、无人超市,还是最近大热的智能音箱,比如正式 开售的可语音购物的天猫精灵。但这些真是能解决痛点的AI吗?
近日,在AI领域赢得先机并明确将赴美上市的搜狗,推出了一款小众的免费产 品一一“搜狗听写”,目的是为了解决会议、采访、写作等场景下长语音内容转 写难,可以将语音实时转变成文字,并能标注重点、边写边改进行文字编辑。
“听写”和“转写”为文字工作者减负
采访一小时,整理录音三小时,写稿两小时……这是《机器人产业》杂志记者的 工作常态,相信也是大多数同行的日常,而且除了记者编辑,包括职业写作者、 会议记录整理者在内的不少文字工作从业人员都有相似遭遇。
当然,人工速记能够解决部分难题,但一有专业性的门槛,有些速记记录的术 语实在不忍多看;二是时间上需要排期,费用上也需要考虑,并不是所有的“扒 速记”工作都能如愿“转包”出去。当然,市面上也有类似的工具,提供付费的 转写服务,只是准确率仍差强人意。
再看''搜狗听写”这款免费的APP,确实是击中了部分人的需求。从功能上看, 提供包括“听写”和“转写”在内的两种模式:“听写”模式可在录音的同时给 出实时识别结果;“转写”模式则可在离线状态下录音,录音完成后一次性获取 文字结果。
它还提供边听边改(保存录音后,可以边听录音边修改文字)、根据语义自动添 加标点、支持文本/语音标重点、多客户端同步、信息分享等功能,并且在人的 说话音量低至30分贝时,依然可以识别。
值得一提的是它的“大杀器”功能,可以根据记者、作家、自媒体等文字工作者 的需要,连接搜狗输入法的个人词库,引入个性化词汇,比如《机器人产业》的 公众号机器人圈的昵称“圈圈”估计就属于独门。
此外,“搜狗听写”还将推出Windows版,专注大会场景的实时速记。
“喂”数据才能更强大
对于有着强大需求的《机器人产业》杂志记者,在现场已经迫不及待地试用了一 下产品。
对此,机器人圈记者也采访了搜狗公司语音交互技术中心总经理王砚峰。他表示, 所有的搜狗语音类产品背后都是知音引擎,不过,一般面向具体的场景会有优 化,有专门的语音模型。在演讲、聊天的场景下,和车载、会议以及手机近场说 话的语音模型都是不尽相同的。
搜狗语音交互技术中心技术总监陈伟还介绍,“搜狗听写”使用了搜狗知音引 擎的长时语音转写技术,从立项到现在,错误率已经下降30%。在声学模型方面, 它采用了端到端深度神经网络技术Deep LC-CLDNN+CTC技术,转写模式则使用了 DeepCNN+CTC的方式,语言模型基于T级海量输入法文本数据使用神经网络进行 建模。
\大杀器
国民输入法的个人词库,即将和搜狗听定
中国联通4G
上午10:11
<返回
记事写作
.。。:。。
01:00
|||||
播方:
00:00:00
你好,我是机器人圈,我们是一家垂