计算机行业投资报告:果发布智能音箱HomePod 语音交互重获关注
北京时间2017年6月6日凌晨1点,第28届WWDC苹果全球开发者大会如期而至,本次WWDC大会上主要发布6项产品:最新的iOS11,MacOS,TVOS,WatchOS,以及iPadPro和HomePod两款硬件产品。其中最具战略意义当属,智能音箱产品HomePod。HomePod除了拥有与Echo类似的助手功能,如语音操控实现音乐播放、播报交通信息、新闻、天气、股票、发送信息,定时器等,还有着非常棒的音频技术、音乐的空间感。
亚马逊、谷歌与苹果等巨头纷纷涉足智能音箱抢占智能搜索入口。从14年底亚马逊推出语音交互产品Echo以来,众多厂商纷纷加入语音交互产品争夺,16年谷歌推出类似产品GoogleAssisitant,近期微软年度开发者Build2017盛会上,微软发布了与音频设备制造商哈曼·卡顿合作打造的智能音箱Invoke,该音箱硬件设备由哈曼·卡顿制造,内置Cortana语音助手。巨头纷纷加入智能音箱争夺,一方面是由于语音交互技术突破以后逐渐与触控成为两大主流交互方式,另一方面语音交互将用户与服务直接连接,提升智能硬件用户体验,未来有望占领智能硬件的搜索入口,商业价值巨大。
当前近场触控的操作习惯用户已是根深蒂固,用户进场交互习惯的迁移成本较高,所以用户对手机上的语音交互助手使用意愿一直难有起色。语音交互是人类最自然的交互方式,当前语音交互使得远场操控体验得到大幅提升,同时在近场文字输入与非标指令的输入语音交互拥有较大优势,所以随着语音识别与语义理解技术快速发展以后,语音识别远场应用率先开始商业化。未来随着用户语音交互习惯逐渐培养以及技术成熟,像手机助手等近场应用逐渐开始普及,语音交互也有望占领智能硬件的搜索入口。
智能音箱技术上快速发展,体验得到大幅提升。技术上来看,首先语音识别方面的当前识别准确率已达97%(开源软件能够达到92%左右),错误率以每年30%速度下降,所以当前语音交互的应用技术瓶颈主要在语义理解与多轮对话。自然语音因其组合集合开放性与不完全规律性使得识别语义较为困难,所以即使深度学习的应用准确率也只提升到70-80%的水平。但是我们对场景进行限定+自定义数据库能够使得场景语义识别准确率超过90%,如车载与电视助手(场景有限,打电话、听歌、搜地图、搜节目等)、儿童服务与陪伴机器人(场景有限,唱歌、笑话、故事等)智能客服(限定领域)均已开始商业化。智能音箱等家庭助手,场景相比车载与电视助手较多,但场景也是有限的,能够通过对各个场景进行优化提升识别准确率,如Echo1000-2000人经过4年开发体验相比Siri有大幅提升,随着15年向第三方开发目前场景功能已超过10000个,出货量已经超过1000万台。
产品体验方面,据experian对1300名Echo用户的使用调查统计,与siri差强人意的用户体验相比,Echo满意度能够达到95%相比Siri61%的满意度有较大幅度提升。所以我们看到相比用户Siri使用意愿逐渐下降不同,Echo满意度与出货量均在大幅提升。
所以,当前通过对有限常用功能的优化,以及开放平台整合第三方服务,能够使得开放性交互体验大幅提升,消除当前开放环境助手产品的技术障碍,使得交互产品体验大幅提升。
相关报告:2017-2021年中国人机交互市场投资分析及前景预测报告