语音识别,标注数据

article/2025/8/21 19:20:37

切割音频文件

from pydub import AudioSegment
from pydub.silence import split_on_silence
import ossound = AudioSegment.from_mp3("E:/data/AcsData/zfBX/hw202003301111246_23401.wav")
loudness = sound.dBFS
outputPath = "E:/data/AcsData/zfBX/output/"
chunks = split_on_silence(sound,# 以沉默500毫秒,切割音频文件min_silence_len=500,# 低于45分贝的声音过滤silence_thresh=-45,#为截出的每个音频添加多少ms无声keep_silence=400)
print('总分段:', len(chunks))
for i, chunk in enumerate(chunks):if os.path.exists(outputPath+"chunk{0}.wav".format(i)):os.remove(outputPath+"chunk{0}.wav".format(i))chunk.export(outputPath+"chunk{0}.wav".format(i), format="wav")

智能识别音频

使用了百度acs识别接口

from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = '你的appid'
API_KEY = '你的AK'
SECRET_KEY = '你的SK'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 读取文件
def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()path = "E:/data/AcsData/zfBX/output" #文件夹目录
files= os.listdir(path) #得到文件夹下的所有文件名称
s = []
strData=""
for file in files: #遍历文件夹if not os.path.isdir(file): #判断是否是文件夹,不是文件夹才打开f = open(path+"/"+file); #打开文件fileName = get_file_content(path+"/"+file)# 识别本地文件a = client.asr(fileName, 'wav', 16000, {'dev_pid': 1537,})print("识别文件:",f)s.append(a.get('result')) #打印结果strData=strData+""+str(a.get('result'))
print(s)
#文件保存
with open(path+'output.txt','w') as f:f.write(str(strData))

识别结果:(内容太长,只展示部分结果)
[‘喂你好。’],[‘您好,请问什么可以帮您,帮我查一下我这个用电的户号啊?’],[‘然后我叫那个叫李琴。’],[‘然后叫那个叫李。’],[‘李先生,请问的。’],[’ 您这边集中一下,用户联系地址绑定的银行卡,电话号码,这边都是能问一下行的。’],[‘呃,就是需要说哪一些吗?’],[‘姓名。’],[‘绑定的电话号码,银行卡号。’],[‘啊,我这边呢是那个广州市珠海区环卫街十号。’],[‘就算请问是珠海还是海珠区呢啊,海珠区。’],[‘海珠区然后呢?’]…

获取appid等信息地址:https://console.bce.baidu.com/ai/?_=1589890413217&fromai=1#/ai/speech/app/detail~appId=262785
在这里插入图片描述


http://chatgpt.dhexx.cn/article/5yg0OiKT.shtml

相关文章

音频标注工具

ASR音频标注工具 前言一、音频标注工具二、使用环境总结 前言 为了方便查看音频标注质量,使用图形化音频标注工具可以更方便的对音频文本内容进行编辑。 下载链接: https://download.csdn.net/download/weixin_54971024/85426511 一、音频标注工具 主页…

数据标注工具、平台、类型

华为云ModelArts标注工具,支持的标注类型有: 图片: imgClassify 图像分类:识别一张图片中是否包含某种物体 objDetect 物体检测:识别出图片中每个物体的位置及类别 imgSevering 图像分割:根据图片中的物体…

Python-实现语音识别并批处理标注(重命名)文件

由于我的测试经常需要对音频文件内容标注(根据语音的内容用拼音标注),一个一个人工标注很费时费力!那有没有简单点的方法,答案是有!!!一起学习吧~ 1.在百度AI开发平台获取AppID、AP…

景联文科技提供语音数据采集标注服务

什么是语音标注? 语音标注是数据标注行业中一种常见的标注类型,是由标注员对语音信息进行不断标注转写,让人工系统进行进一步学习,标注后的数据主要用于人工智能机器学习,相当于给计算机系统装上了“耳朵”&#xff0…

语音数据标注工具与平台/公司

最近在做语音深度学习的项目,整理了一下语音数据标注工具和语音标注平台,供大家参考 语音标注工具--Praat Praat是目前已经成为比较流行也比较专业的语音处理的软件,可以进行语音数据标注、语音录制、语音合成、语音分析等等,具有…

语音标注必须了解的基础知识点

昨天发了一遍关于语音数据标注工具Praat的基础使用,后台收到了很多小伙伴的留言,想了解一下更多的语音相关的知识,也想深入的学习一下,所以今天继续写一篇关于语音相关的基础知识,不管是数据标注还是刚了解语音相关AI技…

景联文科技|浅谈常见的语音标注方法

语音标注是数据标注行业中一种比较常见的标注类型。 语音标注的主要工作内容是将语音中包含的文字信息、各种声音“提取”出来,再进行转写或合成,标注后的数据主要用于人工智能,应用在机器学习、语音识别、对话机器人等领域。相当于给计算机…

景联文科技:关于语音标注,你知道多少?

近年来,随着人工智能技术的迅速发展,语音识别(ASR)、语音合成(TTS)技术正不断突破。语音识别技术已深入到日常生活中的方方面面,语音助手、智能音箱、智能客服等都是较为典型的应用场景。在这些…

PyQt5实战之语音标注工具

UI设计采取简单明了的设计风格如下图 首先参考如何播放一个音频文件 https://zhuanlan.zhihu.com/p/60907386完整代码 https://link.zhihu.com/?targethttps%3A//github.com/CharlesPikachu/Tools/tree/master/MusicPlayer目前可以实现音频波形 可实现 开始和结束位置的显示…

语音标注的具体应用场景

语音标注是我们的标注员不断地对语言信息进行转写,让人工系统进行学习的过程。目前,语音识别技术在我们日常生活中的很多方面都有所普及,例如我们的微信翻译、语音助手、智能音响、智能客服等,随着人工智能的逐步发展,…

语音标注实验

前言: 语音标注是基础中的基础。 文章目录 1 首先是学会手动标注的过程 pratt工具的使用1.1[Praat将连续录制的声音文件切成小单位文件](https://blog.csdn.net/shaopengfei/article/details/20928683)1.2Pratt工具的操作 可以参考这个文件1.3 Pratt可以做什么呢&am…

八种常见的语音标注方法 | 语音标注

科技冬奥,是前不久刚刚结束的2022年北京冬奥会提出美好愿景。科大讯飞作为冬奥会的“翻译官”,为冬奥会提供了自动翻译和相关的多语种语音转换、语音识别以及语音合成等一系列技术,展现出了满满的科技文化。 数据标注的重要性 随着人工智能的…

Praat语音标注说明

经常使用这个工具,隔太久就会忘记,这里总结和记录一下。 1 下载 Praat官网 praat github praat6121_win64.zip 字体文件DoulosSIL-5.000.exe 解压直接使用双击Praat.exe即可 2 使用技巧 2.1 首次打开Praat 只要Praat Objects窗口,关闭Pra…

语音标注工具介绍

人工智能业内普遍认为,语音将成为下一个重要的技术平台,近年来随着人工智能理论与技术的迅猛发展,语音识别(ASR)、语音合成(TTS)技术在不断突破。虽然理论技术取得了长足进步,但是在…

语音数据标注工具与平台

最近在做语音深度学习的项目,整理了一下语音数据标注工具和语音标注平台,供大家参考 语音标注工具–Praat Praat是目前已经成为比较流行也比较专业的语音处理的软件,可以进行语音数据标注、语音录制、语音合成、语音分析等等,具…

Snappy Ubuntu 入门

在这篇文章中,我们将介绍Snappy Ubuntu的一些基本知识.我们将介绍如何在我们的电脑上安装KVM,并利用它来学习Snappy的一些基本的命令.在前面的文章" 到底Snappy Ubuntu是什么?"中,我们已经介绍…

Linux--Ubuntu入门篇(在Ubuntu中安装软件)

1. 方法: (1)APP Store安装 (2)Sudo apt-get install安装法 (3)deb软件包安装 (4)自己下载源码编译安装 (5)其他安装方法 2. (1&am…

Linux--Ubuntu入门篇(Ubuntu下的磁盘管理)

引言: U盘类型: FAT32 (U盘右键属性) 一、Ubuntu磁盘文件(在/dev中) /dev/sd* 文件,此类文件时磁盘设备文件,并不能直接访问磁盘,必须要将磁盘挂载到某一个目录才可以访问。(sd* …

Linux之Ubuntu入门篇

Linux之Ubuntu入门篇 第1讲 开发电脑的选择 第2讲 VMware软件安装和虚拟机创建 第3讲 Ubuntu操作系统的安装 第4讲 Ubuntu初次体验 第5讲 虚拟机连接USB设备 第6.1讲 Ubuntu终端操作与Shell命令1 显示当前问价夹下所有文件详细信息 ls -al回跟目录 cd /显示当前路径 pwd系统信…

Linux-Ubuntu入门到精通之远程操作指令

目录 1️⃣shutdown2️⃣查看或配置网卡信息3️⃣网卡和IP地址4️⃣ifconfig5️⃣ping6️⃣远程登录和复制文件7️⃣ ssh 基础(重点)8️⃣域名 和 端口号9️⃣SSH 客户端的简单使用1️⃣0️⃣Windows 下 SSH 客户端的安装1️⃣1️⃣scp(掌握&…