语音交互的用户体验

article/2025/11/6 14:01:37

这里写图片描述

突发奇想,抛出问题

今天突然想到这个问题。

到底怎么样的体验才是好的语音交互体验?这个问题对于语音技术开发人员可能想的很少,尤其是当前语音技术处于一个时代的风口浪尖的年代,作为从业者,每天面对者五花八门的技术需求,我们缺乏时间思考什么才是好的,合适的语音交互体验,我们疲于应对客户需求,寄希望于客户需要的就是终端用户需要的, 被动的手忙脚乱,但是,事实上,语音交互设计到的技术链条很长,语音技术提供商所面对的客户,他们对语音技术的了解可能仅局限于链条上末端的几个技术节点,而要想有一个良好的体验,任何一个节点未得到很好的设计,最后呈现在最终客户面前的,就是一个糟糕的产品,这也就是我们熟悉的木桶理论。

所以,究竟用户需要什么样的语音交互体验呢,就目前来看,我们还没有找到一个比较漂亮的答案。

现在呢

交互方式

实现语音交互的几个要素:

  • 音频采集设备(Microphone)
  • 音频传输媒介 (Bluetooth,WIFI,I2S…)
  • 音频数据处理中心(MCU, DSP,CPU, NPU, GPU …)
  • 音频播放设备(Speaker)

要想深入这个问题,这边先了解下当前智能设备普遍的语音交互方式。

  • 2 Step
    最为普遍的交互方式:
  1. 唤醒
  2. 对话
  • One-shot
    所谓one-shot,即可以将唤醒和对话同时完成,即唤醒+对话一次性说完,随即反馈结果

  • 短时免唤醒模式
    google assistant 目前引入了短时免唤醒模式,即一次唤醒之后的一段时间内,可以于google assistant 进行连续对话,而不需要每次停顿后再进行唤醒。进一步提升了交互体验,减少了频繁唤醒的繁琐流程。

应用场景

业界一直在探讨语音交互是继鼠标键盘,触控后第三代的人机交互技术,但是就目前看来,还远远没有达到替代先辈技术的程度,当下的语音交互需求主要停留在部分替换的初期交互阶段,主要有以下一些应用场景:

  • 智能设备的控制

    • 电视机端语音控制替换遥控器控制
    • 手机的语音低功耗待机唤醒
  • 情感对话

    • 微软小冰微信聊天模式
    • siri 调戏
  • 个人助手

    • siri 日程设置
    • 天猫精灵音乐播放,闹钟设置

我们真正需要什么

就目前来讲,语音交互的真正完美的用户体验,业界还没有找到一个明确的答案,换句话说,没有给出一个让用户可以长期停留,实现轻度依赖的方案。

从语音交互的要素可以看出,我们首先需要一个录音设备,


http://chatgpt.dhexx.cn/article/Rj8nXxwP.shtml

相关文章

Android 基于百度语音的语音交互功能

项目里面用到了语音唤醒功能,前面一直在用讯飞的语音识别,本来打算也是直接用讯飞的语音唤醒,但是讯飞的语音唤醒要收费,试用版只有35天有效期。只好改用百度语音,百度语音所有功能免费,功能也比较简单实用…

互动之音产品简介-基于语音控制与交互的场景化应用探索

目录 演示地址产品简介工作方式场景分析弊端与优势场景拓展结束语 演示地址 语音互动智慧城市,全程语音操作大屏产品演示_哔哩哔哩_bilibili 产品简介 系统核心是通过自然语言与机器互动,包括:下达指令/问题咨询等交互控制,通…

语音交互技术概述

1.概述 最近做了两个与语音识别相关的项目,两个项目的主要任务虽然都是语音识别,或者更确切的说是关键字识别,但开发的平台不同, 一个是windows下的,另一个是android平台的,于是也就选用了不同的语音识别平…

人机语音交互

首先需要安装speech库,然后运行如下代码: import speechwhile True:sayspeech.input() # 接收语音speech.say("you said:"say) #说话if say"你好":speech.say("How are you?")elif say"天气":speech.say(&quo…

智能语音交互式检索系统

智能语音交互式检索系统 简介和注意事项1. 说话人识别2.模式选择3.个人模式4.会议模式5.插入一段漂亮的代码片 简介和注意事项 历时几个月的项目基本开发完成了,除了一些细节代码还在更改调试。感觉甚是舒服。 注意:项目部分代码将会发布到github上面&a…

语音交互中的一些技术概念

1、语音交互-示意图1(最简版) 科普:语音交互的过程 A)语音识别(Automatic Speech Recognition),一般简称ASR;是将声音转化为文字的过程,相当于人类的耳朵。 B&#…

智能(语音)对话系统架构研究

本文所谈及的架构主要指使用已有的智能对话服务来搭建一个应用系统,而不会深入的探讨智能对话服务内部的架构。 智能对话系统的需求目标 智能对话系统可以提供回答问题的能力,即在理解自然语言的基础上,解答用户提出的问题。进一步的&#x…

人机交互-语音交互方法综述

上图展示了智能语音的界面架构,从中可以看出,语音交互所涉及的技术模块有 4 个部分,如下图所示: 首先,通过应用自动语音识别技术听到用户说的话,然后应用自然语言理解来分析语句的含义,随后用自…

语音助手——简介与交互过程

语音助手简介 语音助手这个产品的目的,是希望通过语音说话的方式,来实现闲聊陪伴、知识获取、设备控制等需求,对应的就有三种不同的助手类型:闲聊型、问答型、指令型。 闲聊型助手用于实现闲聊陪伴的目的,通过AI的技术…

语音交互的基本概念和设计实践

语音技术的发展,将会给我们的产品设计带来极大的改变。未来的产品方向,或者说是人机交互的方式,极可能是视觉与听觉的更加立体的交互,我们会有机会来设计一种完全不一样的用户体验,和完全不同的产品认知。 一、什么是V…

HaaS云端一体智能语音交互方案

1、方案背景 智能语音交互作为物联网领域的一个重要生态成员,是一种全新的交互方式,它能够解放双手,随时提供服务,无须借助任何按键。近年来智能家居逐渐走入千家万户,产业市场规模不断增长。智能家居产品种类繁多&am…

智能语音交互流程

引言 用该文来讲解语音全流程涉及到的技术,整体语音涉及的交互流程如下图: Part1 唤醒 语音唤醒指的是通过预设的关键词即可将智能硬件从休眠状态唤醒,来执行相应操作。 1.1 交互模式 传统模式 唤醒方式:先唤醒设备&#xff…

超全面的语音交互知识总结:从原理、场景到趋势

1. 什么是语音交互? 语音交互(VUI)指的是人类与设备通过自然语音进行信息的传递。一次完整的语音交互需要经历ASR→NLP→Skill→TTS的流程: (1)ASR 用于将声学语音进行分析,并得到对应的文字…

智能座舱-语音交互系统

一.什么是语音交互 语音交互:语音是方式,交互的对象是任何的智能设备,顾名思义,即通过语音的方式完成人与机的交互。 在现今的各种智能化场景中,语音交互已成为一种非常关键的人机交互方式。从用户的角度来看&#x…

为什么我用LaTeX排版的那个双引号编译出来很奇怪,如下图,怎么做才能出现对的?

为什么我用LaTeX排版的那个双引号编译出来很奇怪,如下图,怎么做才能出现对的?) 我是个LaTeX小白,百度了很久,没有解决办法,求救。引号是在英文输入法下输的,左引号连按两次esc下边那个键&#…

latex中怎么输出双引号

在texstudio中,我们输入这个"we",输出的pdf中会是这样同向的双引号 这是由于方式不对,应该是这样写we,左边的那个符号是在键盘上“ESC”下面那个以前没有注意到的一个符号,开启中文方式是这个符号“”,英…

Latex中单引号,双引号

写论文时候,需要写出英文的单引号和双引号 单引号就是 这个符号 双引号的话,如果输入两个英文输入下的"",比如"paper",LaTeX编译显示的话就是两个向下的引号。 正确应该是第一个向上方向的引号 用 这个…

LaTex使用技巧(2):双引号匹配问题

在LaTex中想输出 “”时,若输入 "",则效果如下图所示: 显然,引号不匹配,两个都是下引号。 可采用Tab键上面的 ,用 表示上引号,用两个单引号 表示下引号,效果如下图所示&am…

LaTeX技巧218:LaTeX如何正确输入引号:双引号“”单引号‘’

最近看一些latex用户的文章,输入的双引号和单引号都是用输入法中的中文模式键入,并不是LaTeX的正确输入方式。 正确的输入方法如下: 使用键盘的 Tab键上侧的连续键入两个然后输入键盘的两个单引号。单引号输入类似。示例如下: 演…

0001.Latex中中文双引号和单引号的写法

如何在Latex或者Ctex中输入中文双引号or单引号? 在Latex中,查看Tab键上面的键,在英文状态下连续输入两个,然后输入Enter键左边的单引号’’,输入两次,也是英文状态下哦。 可以将一个矩阵$\cdot$按列拉直成…