如何下载并使用HTK工具包

article/2025/10/7 3:28:39

HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做The HiddenMarkov Toolkit官方网站:http://htk.eng.cam.ac.uk 

这个工具包必须安装VS后才能使用。因为它是基于C进行开发的。HTK工具包的安装需要配置一个VS的环境变量。值得一提的是,我们现在能安装的VS版本中的环境变量路径与HTK工具包中提示的路径大不一样了。像本人安装的VS2017版本的所使用的环境变量为 D:\Microsoft Visual Studio\2017\Community\VC\Auxiliary\Build

 

HTK工具包的安装需要在官网注册后才能下载。解压后,根据HTK自带的README,大家可以按照步骤自行安装。(注:需要在htk文件下的cmd窗口进行操作)

HTK工具包主要有以下几个功能:

   HSLab.exe     录音,标记工具

   Hcopy.exe     从语音提取特征参数的工具

   HInit.exe HCompV.exe HMM模型初始化的工具,注意,这里需要对每个模型都要使用此命令进行初始化

   HRest.exe     对模型进行迭代训练的工具

   HParse.exe    语法转网络的工具,发音转本文用到的。

   HSGen.exe    语法查错工具

   HVite.exe      解码工具,也就是识别工具。可以用命令行方式使用,也可以用交互方式使用。

 

当安装完成后,该如何使用这个工具包呢?笔者以接下来的实验中所用到的提取MFCC特征举例。首先需要新建一个文件夹,然后在复制Hcopy.exe到该文件下,然后需要配置两个文件list.scptr_wav.cfg。整体框架如下:

list.scp文件中写入待提取的WAV文件名与提取MFCC特征后的,mfc文件名。

tr_wav.cfg文件存入提取MFCC特征的参数。

#[MODULE]  PARAMETER                 = VALUE

             SOURCEKIND               = WAVEFORM

             SOURCEFORMAT                  = WAV

             ZMEANSOURCE                    = F               #

             TARGETKIND                = MFCC_E_D_A_Z

             TARGETRATE               = 100000.0 # frame period = 10msec

             SAVECOMPRESSSED          = T

             SAVEWITHCRC            = T

             WINDOWSIZE               = 250000.0 # window size = 25msec

             USEHAMMING              = T

             PREEMCOEF                = 0.97                    # 1st order preemphasis, coefficient = 0.97

             NUMCHANS                  = 26             # num. of filterbank channel = 26

             CEPLIFTER                   = 22             # num. of cepstra = 22

             NUMCEPS                     = 12             # num. of MFCC coefficient = 12

             ENORMALIZE               = T               # energy normalization (live: F, otherwise: T)

             ALLOWXWRDEXP                  = T               # Needed for cross word systems

             FORCECXTEXP           = T               # Needed for cross word systems

#HSHELL Parameters

   HSHELL:    TRACE                            = 0002                   # cotal

#HPARM Parameters

   HPARM:      TRACE                            = 0101

 

#HLABEL Parameters

   HLABEL:    TRACE                            = 0010        

#HNET Parameters

   HNET:         TRACE                            = 0001                   # Needed for recognition

#HREc Parameters

   HREC:        FORCEOUT                   = T

 

在这个文件夹下打开cmd,运行 hcopy -A -D -T 1 -C tr_wav.cfg -S .\list.scp  ,即可提取出所需要.mfc文件。

成功的标志如下图所示:

参考博客:

1.https://blog.csdn.net/qq_36444303/article/details/100164507?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control

2.https://blog.csdn.net/jojozhangju/article/details/18714961


http://chatgpt.dhexx.cn/article/JEfVYGgq.shtml

相关文章

HTK语音识别工具包的安装和编译

今天介绍一下HTK语音识别工具包的安装和编译,希望能够帮助到更多做语音相关工作的同仁们。 介绍: HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做HiddenMarkov Toolkit。 官…

语音识别之HTK入门(七)——HERest训练模型之Baum-Welch算法

上一个博客为B-W算法准备了基础,也就是前向算法和后向算法以及EM模型。 现在看看到底Baum-Welch算法是如何利用上述算法及模型来更新HMM的参数的。 之前也分析过多次了,在语音识别领域HMM模型之所以这么复杂,是因为观察向量对应的隐含状态不…

https tk6 us

https.tk6.us专题,为您展现优质的https.tk6.us各类信息,在这里您可以找到关于https.tk6.us的相关内容及最新的https.tk6.us贴子。 https.tk6.us服务器iP: 当前解析: 未查找到结果! 历史解析记录: 2022-09-29-----2023-05-024…

基于HTK的连续语音识别系统搭建学习笔记(一)

放假之前,就已经对HTK上完成连续语音识别的实验充满兴趣。于是找了很多资料,准备在放假的时候好好学习,仔细琢磨,HTK博大精深,光学习和完成孤立词识别肯定是不够。从今天开始,开始同步学习和记录基于HTK的连…

HTK在windows下的配置说明

本文档意在详细介绍在windows环境下如何配置编译HTK,是根据网上资料及自己实际操作步骤编写而成,一方面是为方便以后使用此工具的朋友们有个参考,另外一方面是给自己加深印象。 准备事项 安装Microsoft Visual Studio开发环境(以下简称VS),因为HTK代码需要通过VS来编译。…

HTK工具搭建识别器的总体框架

老早之前就学习了HTK工具,并用于搭建连续语音识别器,但是好久没有用对于一些东西又忘记了,现在由于做实验需要用到HTK,又重新看了一遍,所以把一些大致的东西记录下来,以后可以直接看这个。感觉用HTK搭建识别…

HTB-OpenKeyS

HTB-OpenKeyS 信息收集80端口立足于JenniferJennifer -> root 信息收集 80端口 对其进行简单的SQL注入测试和NoSQL注入测试后进行目录扫描。 auth.swp文件内容如下: 代码不是很完整,只能大致了解意思(请原谅我脑子抽了没注意是个swp交换…

HTK工具的安装

首先下载HMM 的开发包HTK,现在的版本是3.4.1.可以从CMU的官网进行下载。 http://htk.eng.cam.ac.uk/,下载后解压HTK工具包,我解压后的目录为:D:\htk\ 确保的环境变量Path包含路径:C:\Program Files\Microsoft Visual S…

HTK的使用方法

一,HTK目录结构 htk是一个开源的软件,解压之后的目录如下: [rootlocalhost htk]# ls AUTHORS config.status env HTK HTKTools Makefile.in ChangeLog config.sub FAQ HTKBook install-sh README co…

语音识别之HTK入门(一)HTK的下载配置

语音识别之HTK入门(一)HTK的下载配置 Linux环境配置VMware Tools安装必备环境 HTK下载HTK环境设置 跪拜大佬帖子: https://www.cnblogs.com/ansersion/p/4155828.html 基本按照大佬的帖子进行调试的,为表示敬意,全程跪…

HTK学习笔记(一)

HTK学习笔记(一) 一、HTK软件体系结构 HTK的软件体系结构 HTKTool各部分的功能: 所有的语音输入和输出都是通过HWAVE或HPARM HAudio:用于从音频设备输入波形 HWave:用于从文件中读取波形 HSLab:波形显示工具,可以用于采集语音…

基于htk工具包的语音识别

htk简介: HTK是一个构建隐藏马尔可夫模型(HMMs)的工具包。HMMs可以用于任何时间序列的建模建模,HTK的核心就是类似的通用目的。然而,HTK主要设计用于构建基于HMM的语音处理工具,特别是识别程序。因此,大部分HTK中的基础设施支持专门用于此任…

jQuery学习手册(15)

逐个设置 $(div).css(width, 100px)​ $(div).css(height, 100px)​ $(div).css(background, black)链式设置 注意:如果大于3步,建议分开 $(div).css(width, 100px).css(height, 100px).css(background, black)批量设置 $(div).css({ ​ …

第7章页面布局-ConstrainedBox限定宽高

防采集标记:亢少军老师的课程和资料 import package:flutter/material.dart; class LayoutDemo extends StatelessWidget {overrideWidget build(BuildContext context) {return new Scaffold(appBar: new AppBar(title: new Text(ConstrainedBox限定宽高示例),),b…

全网最详细的一篇Flutter 尺寸限制类容器总结

Flutter中尺寸限制类容器组件包括ConstrainedBox、UnconstrainedBox、SizedBox、AspectRatio、FractionallySizedBox、LimitedBox、Container。这些组件可以约束子组件的尺寸,下面一一介绍。 ConstrainedBox ConstrainedBox组件约束子组件的最大宽高和最小宽高&am…

android中各种height和width总结

1. getMeasuredWidth()和getWidth() 以这两个为例,高度与其相同。这两个是在自定义View中最常见到的,通过字面意思可以看出,前者是测量的宽度,后者是控件的实际宽度,下面看下官方文档对他们的描述: //Ret…

JavaFX布局(一)

说道GUI编程一定要谈到布局,JavaFX内置了大量的布局控件提供给我们使用。其实,JavaFX的布局控件和界面元素控件都是继承自javafx.scene.layout.Region类。我们这里只看布局控件类。布局控件我们在界面上一般是看不到的,它一个容器用于放置其它…

Android 桌面小组件 AppWidgetProvider

废话 桌面小组件,绝对是小程序中的小程序,说白了就是任何复杂一丁点的操作都不适合做成桌面小组件。 所以这里采用的演示的例子,就只有一个白色圆角背景,外加一个文本框,显示文字。 小组件的教程网上一搜一大堆&…

Android 约束布局 ConstrainLayout min max width

写一个自定义view package com.anguomob.guidelineimport android.content.Context import android.graphics.Canvas import android.graphics.Color import android.util.AttributeSet import android.view.Viewclass ZeroView constructor(context: Context?, attrs: Attri…

ConstrainLayout 基础教程2,近期想跳槽的程序员必看

特性详解 Visibility behavior (可见性的表现) ConstraintLayout对可见性被标记View.GONE的控件(后称“GONE控件”)有特殊的处理。一般情况下,GONG控件是不可见的,且不再是布局的一部分,但是在布局计算上,ConstraintLayout与传统布局有一个很重要的区别: 传统布局下,…