语音助手——简介与交互过程

article/2025/11/6 16:50:16

语音助手简介

        语音助手这个产品的目的,是希望通过语音说话的方式,来实现闲聊陪伴、知识获取、设备控制等需求,对应的就有三种不同的助手类型:闲聊型、问答型、指令型。

        闲聊型助手用于实现闲聊陪伴的目的,通过AI的技术来与用户进行对话,感知用户情绪,比如微软小冰。

        问答型助手用于知识获取,通过对话的方式来获取知识,或者解决疑问,比较常见的应用则是各个平台的智能客服,比如京东、淘宝等都有对应的产品。

        指令型助手用于设备控制,通过对话的方式来控制智能设备,实现某种操作,比较常见的应用有智能音响、IOT设备等,比如,语音控制:“打开空调,然后调成25度”。

        而集成了这三个能力的语音助手,则是以一个集大成者的贴心助理的形式存在,比如vivo的Jovi语音助手、小米的小爱同学、IPhone的siri。        

语音助手交互过程

1、首先,来了解一下从用户发出指令到设备端执行,一共经历了哪些流程:

         由上图可以看出,用户发出语音指令,经过语音识别(ASR)服务器转换为文本,然后经过网关进入自然语言理解(NLU)服务器进行语义理解,理解之后经由对话管理中控(DM)进入技能工具箱得到结构化的控制指令,然后经过语音转文字(TTS)服务将文本信息转为语音信息,进入手机端执行命令并且回复用户。

2、下面我们来简单说下各个模块的作用:

        客户端:这里一般是指设备端,比如:手机、音响、智能设备等,用户通过该设备与语音助手进行交互,实现对话、控制设备等操作。 

        语音识别ASR:ASR实现的功能主要为将语音转换为文字,但其实这里还涉及很多其他技术,一个完整的ASR链路主要包括:语音唤醒、语音输入、静音检测(VAD)、信号处理、特征提取、模型转换等。

        网关服务:网关服务顾名思义,是一个网络连接到另一个网络的“关口”,承担了一些请求鉴权、服务转发、配置下发、流量控制等能力。

        语义理解NLU:语义理解的作用为根据文本信息理解句子的含义,这里包含了很多的模块和技术,一般主要分为query预处理和query理解两个部分,在query预处理中一般包含query纠错、问句改写等,在query理解中一般包含分词、依存句法分析、命名实体识别(NER)、场景识别、意图识别、槽位提取、情感分析等。

        对话管理DM:DM控制着人机对话的状态,他的输入为当前的用户输入(经过语义理解之后的内容),输出为下一步的系统行为和更新后的状态。DM中一般需要负责:BOT的分发、BOT结果排序、对话状态维护(DST),多轮会话一般就是在这里控制的,后续的文章中会详细讲解DM和多轮对话的实现。

        技能工具箱:这里存放着支持的各个技能,比如:播放音乐(play_music)、查询天气(weather_forecast)、闹钟操作(operate_alarm)等,这里的技能指的是客户端可以执行的内容,是语义内容经过技能封装、知识填充、知识校验等操作后生成的结构化的数据,客户端拿到后可以直接执行。        


http://chatgpt.dhexx.cn/article/KRoFHZZ8.shtml

相关文章

语音交互的基本概念和设计实践

语音技术的发展,将会给我们的产品设计带来极大的改变。未来的产品方向,或者说是人机交互的方式,极可能是视觉与听觉的更加立体的交互,我们会有机会来设计一种完全不一样的用户体验,和完全不同的产品认知。 一、什么是V…

HaaS云端一体智能语音交互方案

1、方案背景 智能语音交互作为物联网领域的一个重要生态成员,是一种全新的交互方式,它能够解放双手,随时提供服务,无须借助任何按键。近年来智能家居逐渐走入千家万户,产业市场规模不断增长。智能家居产品种类繁多&am…

智能语音交互流程

引言 用该文来讲解语音全流程涉及到的技术,整体语音涉及的交互流程如下图: Part1 唤醒 语音唤醒指的是通过预设的关键词即可将智能硬件从休眠状态唤醒,来执行相应操作。 1.1 交互模式 传统模式 唤醒方式:先唤醒设备&#xff…

超全面的语音交互知识总结:从原理、场景到趋势

1. 什么是语音交互? 语音交互(VUI)指的是人类与设备通过自然语音进行信息的传递。一次完整的语音交互需要经历ASR→NLP→Skill→TTS的流程: (1)ASR 用于将声学语音进行分析,并得到对应的文字…

智能座舱-语音交互系统

一.什么是语音交互 语音交互:语音是方式,交互的对象是任何的智能设备,顾名思义,即通过语音的方式完成人与机的交互。 在现今的各种智能化场景中,语音交互已成为一种非常关键的人机交互方式。从用户的角度来看&#x…

为什么我用LaTeX排版的那个双引号编译出来很奇怪,如下图,怎么做才能出现对的?

为什么我用LaTeX排版的那个双引号编译出来很奇怪,如下图,怎么做才能出现对的?) 我是个LaTeX小白,百度了很久,没有解决办法,求救。引号是在英文输入法下输的,左引号连按两次esc下边那个键&#…

latex中怎么输出双引号

在texstudio中,我们输入这个"we",输出的pdf中会是这样同向的双引号 这是由于方式不对,应该是这样写we,左边的那个符号是在键盘上“ESC”下面那个以前没有注意到的一个符号,开启中文方式是这个符号“”,英…

Latex中单引号,双引号

写论文时候,需要写出英文的单引号和双引号 单引号就是 这个符号 双引号的话,如果输入两个英文输入下的"",比如"paper",LaTeX编译显示的话就是两个向下的引号。 正确应该是第一个向上方向的引号 用 这个…

LaTex使用技巧(2):双引号匹配问题

在LaTex中想输出 “”时,若输入 "",则效果如下图所示: 显然,引号不匹配,两个都是下引号。 可采用Tab键上面的 ,用 表示上引号,用两个单引号 表示下引号,效果如下图所示&am…

LaTeX技巧218:LaTeX如何正确输入引号:双引号“”单引号‘’

最近看一些latex用户的文章,输入的双引号和单引号都是用输入法中的中文模式键入,并不是LaTeX的正确输入方式。 正确的输入方法如下: 使用键盘的 Tab键上侧的连续键入两个然后输入键盘的两个单引号。单引号输入类似。示例如下: 演…

0001.Latex中中文双引号和单引号的写法

如何在Latex或者Ctex中输入中文双引号or单引号? 在Latex中,查看Tab键上面的键,在英文状态下连续输入两个,然后输入Enter键左边的单引号’’,输入两次,也是英文状态下哦。 可以将一个矩阵$\cdot$按列拉直成…

latex中双引号和单引号的正确应用

用输入法中的中文模式键入的双引号和单引号并不是LaTeX的正确输入方式。 正确的输入方法如下: 使用键盘的 Tab键上侧的 连续键入两个然后输入键盘的双引号’’。 单引号输入类似。示例如下: 演示代码: \documentclass{article} \setlength…

LaTeX:引号

LaTeX \LaTeX LATE​X 引号 文章目录 LaTeX \LaTeX LATE​X 引号1. 简而言之2. 单引号3. 双引号 1. 简而言之 英文状态下, 键盘主区域 “ESC” 键下、“1” 号数字键旁边的那个键 “” 和 “” 符号,分别用于控制 左单引号 和 左双引号. 2. 单引号 如…

LaTeX 如何使用双引号,单引号

LaTeX 如何使用双引号,单引号 使用格式如下: 双引号单引号 示例: \documentclass{article}\author{My Name}\title{The Title}\begin{document}\maketitleThis is single quote markThis is double quote mark \end{document} 输出如下&am…

latex中常见论文错误及其改正

论文常见错误 记录一下latex论文写作中常见错误及其方便快捷的修改过程 1、双空格(多空格) 解决方案:先Ctrlf后Ctrlr,选择性的将论文中的双空格替换为单空格。 2、双引号 原因:使用润色工具润色将双引号去掉了&…

LaTeX 中文段落中显示英文引号的方法

方法 中文的引号直接用 “”或者 英文的引号尝试了半天都不行,但我还是想到了一个办法: 使用行内公式! 英文单引号:$$ 引号内的内容 $$ 英文双引号:$$ 引号内的内容 $$测试效果 latex: 编译结果:

LaTeX如何正确输入引号:双引号“”单引号‘’

最近看一些latex用户的文章,输入的双引号和单引号都是用输入法中的中文模式键入,并不是LaTeX的正确输入方式。 正确的输入方法如下: 使用键盘的 Tab键上侧的LaTeX技巧218:LaTeX如何正确输入引号:双引号“”单引号‘’连续键入两…

latex单引号双引号

https://juejin.cn/s/latex%20%E8%8B%B1%E6%96%87%E5%BC%95%E5%8F%B7

Latex正确输入英文双引号

Latex正确输入英文双引号 最近用LaTex写论文,发现直接输入英文双引号,输出的文字,双引号方向一致。 正确的输入方式应该为: (1) 错误使用英文双引号 "paper"(2) 英文双引号正确使用 paper"(3) 中文双引号 “论文”在键盘上的…