11

语音识别(八)——声纹识别

 2 years ago
source link: http://antkillerfarm.github.io/speech/2020/05/26/speech_8.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

WFST(续)

https://blog.csdn.net/dearwind153/article/details/70053704

Kaldi HCLG深入理解

https://zhuanlan.zhihu.com/p/31174085

有限状态自动机和转换器在元音和谐处理中的应用。这篇blog研究的问题相对偏门,但是文末附有若干FST方面的软件资源,可以提供OpenFST之外的选择。

https://www.jianshu.com/p/5eb45c64f3e3

深入浅出理解有限状态机

http://infolocata.com/mirovia/finite-state-transducers-for-natural-language-processing/

Finite-State-Transducers for Natural Language Processing

https://zhuanlan.zhihu.com/p/23664023

构建CTC语音识别解码网络

https://mp.weixin.qq.com/s/2Un2Vy33dkxPwe8n7d_Yng

一个有限状态机的C++实现

https://mp.weixin.qq.com/s/Li4GUgFcnotVrswgcX4QFQ

语音识别系列之高阶解码器技术

https://mp.weixin.qq.com/s/UUbYxv2L6A7iTxuFS52VRA

语音识别中的WFST和语言模型

声纹识别关心的“谁在说”,用于解决生物身份确认和识别;而语音识别关心的“说了什么”,用于解决对说话内容的识别

对测试语音,同样提取mfcc->提取i-vector,然后进行打分,打分的方法有cosine, LDA, PLDA,其中PLDA的效果是最好的,但是需要数据去训练获得参数。

代码的话,推荐kaldi里的sre10/v1,里面有全套的i-vector/PLDA说话人识别系统流程。

这方面的数据集有:

https://ivectorchallenge.nist.gov

NIST i-vector Machine Learning Challenge

https://zhuanlan.zhihu.com/voicebiometrics

专栏:声纹识别的应用实践

https://www.jianshu.com/p/513dadeef1fd

https://blog.csdn.net/twinkle_star1314/article/details/55049746

https://blog.csdn.net/twinkle_star1314/article/details/55050138

声纹识别2

https://zhuanlan.zhihu.com/p/67088235

声纹识别5大核心知识点

https://zhuanlan.zhihu.com/p/24425179

End-to-End Voiceprint

https://mp.weixin.qq.com/s/I2nbzD2QqSYgahI2jLjYTQ

批训练、注意力模型及其声纹分割应用,谷歌三篇论文揭示其声纹识别技术原理

https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650750181&idx=5&sn=96d85740cb3d696cd2833f35f7908a6b

只对你有感觉:谷歌用声纹识别实现定向人声分离

https://mp.weixin.qq.com/s/Cfk3639bCy55qQj4HM2HWw

人工智能老司机带你认识声音黑科技:声纹识别

https://mp.weixin.qq.com/s/XUHS4o2G-iGuV9uuOmfBdQ

为什么在说话人识别技术中,PLDA面对神经网络依然坚挺?

https://mp.weixin.qq.com/s/bgIJMRZ64En3xMk3IGK-Vw

如何基于迁移学习快速识别出讲话的人是谁?

https://mp.weixin.qq.com/s/I2XU9u28S6LFoTY4kizoqw

清华大学郑方:语音技术与身份信息的隐私保护

https://mp.weixin.qq.com/s/YOupCjU06JhRCZNCbMvAgQ

Google开源新AI模型,语音区分准确率92%创新高

https://mp.weixin.qq.com/s/Cx066B8MCnkl4XY1f2AbbA

NIST评测(SRE19)获胜团队声纹识别技术分析

https://mp.weixin.qq.com/s/buTWsIPPmx9npt6MxSo7EQ

解锁声纹技术中的说话人日志

https://mp.weixin.qq.com/s/uvoj64TVEOP0E3pWV-DkfQ

attention在声纹识别中的应用

https://mp.weixin.qq.com/s/tl6D_A-SuUj_W76yu_pvkg

声纹识别助力身份认证

https://mp.weixin.qq.com/s/QuWKW3Hl8kho9RvHcn-uLQ

声纹分割聚类(Speaker Diarization)概要

https://zhuanlan.zhihu.com/p/22722073

当我谈汽车声学时,我在谈什么(一)

https://zhuanlan.zhihu.com/p/28608243

当我谈汽车声学时,我在谈什么(二)

https://zhuanlan.zhihu.com/p/31240294

当我谈汽车声学时,我在谈什么(三)

https://zhuanlan.zhihu.com/p/34256635

当我谈汽车声学时,我在谈什么(四)

ASR参考资源

https://zhuanlan.zhihu.com/p/40329331

谈谈语音识别与人声的物理原理,以及真声假声头声混声等概念

https://mp.weixin.qq.com/s/CjWNZf225OELIBoWRAbakg

全面了解什么是语音交互

https://mp.weixin.qq.com/s/NZUOy4KOL-19fGxC8JHYGw

语音识别系列之决策树

https://mp.weixin.qq.com/s/FsZqX-Uwk1-ciXTH_vCNng

声学发展史之——超声:寻找杰克,始于泰坦尼克号

https://mp.weixin.qq.com/s/_v-H1eapsBshp-sl7KHh2A

盘点欧洲知名声学实验室

https://mp.weixin.qq.com/s/iS0bz8w9qrKCrQIO2PFN6Q

关于主动降噪耳机,你想知道的一切(一)

https://mp.weixin.qq.com/s/BZMvDn4_mlaoV8m1DqT85A

关于主动降噪耳机,你想知道的一切(二):前馈自适应

https://mp.weixin.qq.com/s/2tq8tMnMGbNfe_javn07Eg

关于主动降噪耳机,你想知道的一切(三)

https://mp.weixin.qq.com/s/jJZ-Gx4cush3We_Nsmo4CA

关于主动降噪耳机,你想知道的一切(四)

https://mp.weixin.qq.com/s/qJS3cyWloNrON5-wCTXucw

关于主动降噪耳机,你想知道的一切(五)

https://mp.weixin.qq.com/s/PXSsMyWeUCOxrzX-5wkp5g

什么是音色?

https://mp.weixin.qq.com/s/BJshUILPcX-xA6ayn8J4oA

听音识瓜:怎样挑选一个好的西瓜?

https://mp.weixin.qq.com/s/hParUanfg0JxagE5Qk0VYQ

噪声控制简史,以及几个简单的声学概念

https://mp.weixin.qq.com/s/6KBQ9CzyMcUPiJTppI5eFQ

耳朵的进化

https://mp.weixin.qq.com/s/J11lDgGsYXLgT7jXmRQtAA

地球上最先进的麦克风,居是苍蝇耳朵

Machine Learning之Python篇++

https://mp.weixin.qq.com/s/-s5K8gl4Xdjh_1xgTn9PZg

维基百科中的数据科学:手把手教你用Python读懂全球最大百科全书

https://mp.weixin.qq.com/s/LiilfmvA5YUaY3QUQD6odA

如何用Python将数据预处理速度提升2至6倍?

https://mp.weixin.qq.com/s/4s7lDKlQjV1mUoVv558Y7Q

面向云数据库,超低延迟文件系统PolarFS诞生了

https://mp.weixin.qq.com/s/VfmudolvWzQN4ghgnI2rZA

机器学习中Python库的3个简单实践——你的图片将由你来创造

https://mp.weixin.qq.com/s/goxciguoxcamTo2WyUd1Lg

大吉大利,今晚如何用Python解锁“吃鸡”的正确姿势

https://mp.weixin.qq.com/s/dQ75O2h1orGzKcaCSDWshQ

自然语言处理是如何工作的?一步步教你构建NLP流水线

https://mp.weixin.qq.com/s/dwxTla5iiYKvELrpbWf1yQ

8个Python高效数据分析的技巧

https://mp.weixin.qq.com/s/TYiqZvY25qxHcmEXRpqO5Q

如何用Python做自动化特征工程

https://mp.weixin.qq.com/s/lfkTryraR22INdPzR0sidg

基于协同过滤的推荐系统实战

https://mp.weixin.qq.com/s/n3gaWuJCt945ycmliJatpA

python语音识别指南终极版

https://mp.weixin.qq.com/s/pDTbiS8xFH0llUBaN1Mb_Q

如何用Python写一个贪吃蛇AI

https://mp.weixin.qq.com/s/WdYa7Q-yA-s_EO59YkYbqw

7个基本机器学习算法Python实现

https://mp.weixin.qq.com/s/EqLzNzzMcwq5SEyBoTsuug

11种NLP文本预处理Python代码,简洁实用

https://mp.weixin.qq.com/s/mCUdK4i6XGEyaWNCIWA-wQ

集五福,我用Python


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK