下一件大事的一瞥——自动语音识别

自动语音识别(ASR)已经发展了几十年。然而,直到最近才取得了重大进展和广泛采用。这是由智能手机和平板电脑等设备的流行所推动的,这些设备没有物理键盘,这意味着语音识别提供了一种潜在的有用输入机制。

苹果对Siri的收购和商业化起到了催化作用,让ASR拥有了更大的用户基础和更多的知名度。谷歌(Google)的Now、微软(Microsoft)的小娜(Cortana)和亚马逊(Amazon)的Alexa都受益于Siri的领先优势,但也受益于Siri糟糕的用户体验。

ASR主要用于执行基本操作,如设备导航,互联网搜索,设置提醒等,作为智能手机实用工具的一部分。然而,将ASR集成到基于云的基础设施的连接设备中,并通过5G网络无缝集成,将恢复其真正的价值。

自然语言处理能力和预测分析的整合将使自动语音识别解决方案从简单的助手变成更接近于用户的高效顾问。未来几年,围绕可穿戴设备和人工智能的生态系统将推动ASR可用性成为下一代设备的关键用户界面选择之一。

在物联网领域,语音识别可以在智能家居中用于控制暖通空调、照明、娱乐和其他连接设备。为了实现这一点,设备接口将需要开发,特别是与麦克风位置和性能相关的接口。

智能手机领域仍将是自动语音识别的主要消费者;它可以作为一个区分点,而其他点很少。苹果目前正在大力推广Siri,尽管与谷歌的Now和微软的Cortana相比,Siri的可用性仍然很差,但两者都实现了更好的语音识别。

高级ASR价值链如下所示。ASR解决方案提供商正在通过不同的途径推动价值链。最终的价值是通过各种应用程序和/或设备交付的。

ASR价值链

Picture1

高效麦克风和相关的降噪技术即将上市,这可能会对ASR的可用性产生变革性影响。亚马逊(Amazon)的Echo设备已经证明,即使在嘈杂的环境中,它也能“听到”指令。像Kopin这样的公司在CES上展示了“耳语语音芯片”,即使背景噪音很高,也能检测到最轻微的语音输入。

亚马逊的Echo与智能手机实现的自动语音识别不同,因为语音控制是Echo的主要功能。它的次要作用是充当扬声器。对于其他设备——无论是智能手机还是智能汽车,语音助手目前还只是次要功能。

然而,随着围绕ASR价值链的技术发展,智能代理的角色可以成为主要特征。我们认为这对物联网、智能汽车和其他应用的进一步发展非常重要,在这些应用中,使用手作为界面可能会有问题。