人工智能助手很流行,你知道它是如何工作的吗?
语音助理设备正变得家喻户晓。目前约有 7 亿人在使用 AI 个人助理,到 2021 年预计将增长到近 20 亿人。从 Google Assistant 到亚马逊 Alexa,再到微软 Cortana,AI 个人助理如雨后春笋不断涌现。 三星最近也推出了 Bixby 助手,而 Facebook 预计明年将实现自主虚拟助手(简称“M”)的商业化。
这些设备的工作原理是什么呢?我们该如何利用其功能?它们内置蓝牙、Wi-Fi 模块(如 Qualcomm QCA9377-3)以及移动平台(如 Qualcomm骁龙移动平台)。 在这篇文章中,我们将探讨人工智能设备是如何工作的。
- 1 -
你能用人工智能助手做什么?
个人助理主要有两种:聊天机器人(或基于文本的交互),以及语音用户界面(或语音激活助手),如前面所述的商业产品。 语音激活助手通常是基于命令的 AI 交互- 你需要“唤醒”并给它下达命令。
语音激活助手是日常工作的理想选择,例如:
信息搜索:通过互联网查找信息,比如时间和天气查询等。
任务处理:设置闹钟,发送消息,播放音乐和视频,在线购物,智能家居协调等。
信息收集:呼叫中心收集用户信息,医疗服务提供初步诊断。
技能培训:通过与AI老师交谈来学习一门新的语言。
信息搜索:通过互联网查找信息,比如时间和天气查询等。
任务处理:设置闹钟,发送消息,播放音乐和视频,在线购物,智能家居协调等。
信息收集:呼叫中心收集用户信息,医疗服务提供初步诊断。
技能培训:通过与AI老师交谈来学习一门新的语言。
语音助手可以帮助用户挣脱键盘、屏幕和拼写检查的束缚,尤其适合无障碍需求。
语音助理的硬件组件包括扬声器和麦克风,蓝牙和 Wi-Fi 模块以及标准计算机体系架构(CPU,RAM)。 虽然设备中内置很多技术,但真正的“大脑”通常驻留在云端。
- 2 -
人工智能助手如何工作?
虚拟助手使用一个触发词(“Ok Google”)来“唤醒”,以确保它只在命令下达时才运行。
音频被记录在设备上,经过压缩并通过 Wi-Fi 传输到云端。通常会采用降噪算法来记录音频,以便云端“大脑”更容易理解用户的命令。
使用专有的“语音到文本”平台将音频转换成文本命令。 通过指定的频率对模拟信号进行采样,将模拟声波转换为数字数据。 分析数字数据以确定英语音素(“bb”,“oo”,“sh”等)的出现位置。 一旦识别出音素,就使用统计建模算法(如 Hidden Markhov 模型)来确定特定单词的可能性。
使用自然语言处理(NLP)技术来处理文本以确定所需的操作。该算法首先使用词性标注来确定哪些词是形容词、动词和名词等,然后将这种标记与统计机器学习模型相结合起来,推断句子的含义。
如果命令操作需要进一步的搜索,系统将立即进行搜索。 例如,“OK,Google,什么是 Snapdragon 移动平台?”将触发互联网搜索,并返回所得到的信息。 如果该命令类似于“Ok Google,发送一条消息”,则命令数据(操作:发送消息,收件人:妈妈)会被直接发送到虚拟助理。
“大脑”在云中构建相应的答案,并且从语音样本数据库中检索最佳的输出词,然后将这些词拼接起来形成句子并返回到硬件向用户播放。
- 3 -
骁龙移动平台:实力助力 AI 语音助手
人工智能语音助手正在引领交互方式的转变。Qualcomm骁龙移动平台在智能手机等终端上,对于自然语言处理的人工智能用例具备诸多优势:
Qualcomm Aqstic 音频编解码器(WCD934x和WCD9335)具备始终在线、低功耗语音激活等特点。
Qualcomm Aqstic 支持回声消除和噪音抑制功能,你可以随时与搭载骁龙移动平台的终端沟通。
Qualcomm Aqstic 音频编解码器(WCD934x和WCD9335)具备始终在线、低功耗语音激活等特点。
Qualcomm Aqstic 支持回声消除和噪音抑制功能,你可以随时与搭载骁龙移动平台的终端沟通。
同时,Qualcomm骁龙移动平台强大的异构计算能力,保证了人工智能语音助手在终端设备上良好运行。通过在适宜的计算引擎(如CPU、GPU 和 DSP等)上运行各种机器学习任务,我们能提供高效的解决方案。
点击阅读原文,了解让音箱成为智能音箱的Qualcomm智能音频平台。
返回搜狐,查看更多
责任编辑: