语音智能商业化迷局:To B还是To C,如何减少用户不安全感?
语音智能商业化迷局:To B还是To C,如何减少用户不安全感?
本报记者 曲忠芳 李正豪 北京报道
近日,微软斥资160亿美元收购智能语音技术公司Nuance的交易,已获得了美国反垄断批准。今年4月,这笔微软史上第二大规模的收购案的公开,给作为人工智能(AI)重要技术分支的智能语音赛道带来了不少关注。
清华大学人工智能研究院听觉智能研究中心主任郑方在接受《中国经营报》记者采访时指出,美国大型科技公司的商业并购常见,微软收Nuance对行业来说,实质上的影响并不明显。不过它确实给智能语音这个在外界看来“小众”的行业,吸引了一些关注的目光。
成立于2016年、对标Nuance的国产厂商声智科技联合创始人常乐认为,Nuance获得高溢价收购,是因为其价值不仅仅在于语音技术和算法,还有数据方面的优势。
国内智能语音市场当前处于什么样的发展阶段?围绕智能语音领域创业的AI公司过得怎么样?智能语音的商业化应该如何破局?……这些关于智能语音广受关注的疑问,本报记者通过采访学术界、产业界相关人士获悉,智能语音发展是目前AI领域发展相对成熟的分支,同时它自身又有很多分支,不同分支技术的成熟度各不相同。从技术层面来说,智能语音技术与多种AI技术的融合成主流趋势,而从商业层面来说,整体的商业化模式仍在探索突破过程中,在To C还是To B以及是否在底层做芯片、操作系统等转型路径中呈现明显的分化。
技术发展离不开市场“土壤”
语音识别早在半个世纪前就诞生了,但一直处于不温不火的状态,直到2009年随着深度学习技术的兴起,语音识别精准率得到显著提升。2016年前后,由于“端到端”技术发展,语音识别广泛进入大众视野,如苹果手机的语音助手Siri,以及百度、阿里巴巴、小米等各种各样的智能音箱等。
在搜狐科技《中国创新公司100》沙龙讨论中,郑方指出,语音处理技术包含很多分支,如语音合成、声纹识别、情感识别、信号分类等,不同的分支技术又处于不同的发展阶段,如语音识别目前相对比较成熟,但在口音、低资源语种等问题方面也存在很多待突破的技术难题。
郑方表示,“语音处理技术的发展离不开市场的土壤,用单一技术解决问题本身就有很大的问题。市场真正需求的是解决问题的综合方案,利用需求找到不同技术的融合方案去解决问题。”
常乐对此持类似看法,她表示“用户对于场景的需求远远不是一个交互方式改变的问题,对于技术公司来说,研发技术并不是为了‘自嗨’,而是帮助用户解决它的痛点需求。”目前,该公司发力的重点包括医疗大健康、智慧城市、智慧生活三个领域。
国内老牌智能语音巨头科大讯飞AI研究院副院长陈志刚认为,人工智能近十年的快速发展离不开算法、算力、数据三个要素,三者之间相辅相成,缺了哪个都不可能取得目前的技术进步。对于语音技术来说,大部分场景和应用在这三方面都建立了较好的基础,不过还需要在两个层面突破,一是算法,目前语音技术还存在“难啃的骨头”,如前端的声学降噪算法、声学信号处理算法、麦克风阵列算法,以及角色分离、语义理解等,要实现语音技术的突破和长足发展必须攻克这些困难;一是数据,在很多场景下数据的采集和获取受到一些限制。