7

随想录(从kaldi学习语音识别)

 3 years ago
source link: https://blog.csdn.net/feixiaoxing/article/details/102617071
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

随想录(从kaldi学习语音识别)

original.png
费晓行 2019-10-17 23:46:44 articleReadEyes.png 283

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】

    语音识别是一个技术活。之前一直不是很了解,特别是听到梅尔倒谱系数、GMM、HMM、DNN、NLP这些概念的时候就头疼。今天晚上,趁着有时间,看了一下kaldi的基本代码,心里有了一些基本的概念。

1、代码地址

https://github.com/kaldi-asr/kaldi

2、主要目录

tools/,提示安装哪些第三方软件

src/,源代码目录

egs/,示例工程目录

3,主要的开发语言

cc、shell、perl

4、最简单的范例

https://github.com/kaldi-asr/kaldi/tree/master/egs/yesno/s5

5、使用方法

先编译tools下面的第三方库,接着编译src代码,最后选择一个egs工程运行,

可以参考这个链接

6、最简单的范例脚本

上面提到的yesno是最简单的工程,那我们可以看一下最简单的脚本run.sh

kaldi基本上是用脚本驱动来完成各个工程范例的,但是逻辑都比较类似

7、中文范例

thchs30

8、kaldi中文资料

https://download.csdn.net/download/u010384318/7768237

9、搭建自己的语音识别工程

整个kaldi是脚本驱动的,你可以在此基础上搭建自己的项目,比如参考这个链接

https://blog.csdn.net/m0_38055352/article/details/82416633

10、kaldi的学习方法

根据知乎上同学的说法,最好的kaldi学习方法就是跑样例,边看文档边调试,这样效率最高。

可以到https://www.zhihu.com/question/57230747/answer/244383490看看他们详细的说法。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK