语音识别(八)——声纹识别
source link: http://antkillerfarm.github.io/speech/2020/05/26/speech_8.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
WFST(续)
https://blog.csdn.net/dearwind153/article/details/70053704
Kaldi HCLG深入理解
https://zhuanlan.zhihu.com/p/31174085
有限状态自动机和转换器在元音和谐处理中的应用。这篇blog研究的问题相对偏门,但是文末附有若干FST方面的软件资源,可以提供OpenFST之外的选择。
https://www.jianshu.com/p/5eb45c64f3e3
深入浅出理解有限状态机
http://infolocata.com/mirovia/finite-state-transducers-for-natural-language-processing/
Finite-State-Transducers for Natural Language Processing
https://zhuanlan.zhihu.com/p/23664023
构建CTC语音识别解码网络
https://mp.weixin.qq.com/s/2Un2Vy33dkxPwe8n7d_Yng
一个有限状态机的C++实现
https://mp.weixin.qq.com/s/Li4GUgFcnotVrswgcX4QFQ
语音识别系列之高阶解码器技术
https://mp.weixin.qq.com/s/UUbYxv2L6A7iTxuFS52VRA
语音识别中的WFST和语言模型
声纹识别关心的“谁在说”,用于解决生物身份确认和识别;而语音识别关心的“说了什么”,用于解决对说话内容的识别。
对测试语音,同样提取mfcc->提取i-vector,然后进行打分,打分的方法有cosine, LDA, PLDA,其中PLDA的效果是最好的,但是需要数据去训练获得参数。
代码的话,推荐kaldi里的sre10/v1,里面有全套的i-vector/PLDA说话人识别系统流程。
这方面的数据集有:
https://ivectorchallenge.nist.gov
NIST i-vector Machine Learning Challenge
https://zhuanlan.zhihu.com/voicebiometrics
专栏:声纹识别的应用实践
https://www.jianshu.com/p/513dadeef1fd
https://blog.csdn.net/twinkle_star1314/article/details/55049746
https://blog.csdn.net/twinkle_star1314/article/details/55050138
声纹识别2
https://zhuanlan.zhihu.com/p/67088235
声纹识别5大核心知识点
https://zhuanlan.zhihu.com/p/24425179
End-to-End Voiceprint
https://mp.weixin.qq.com/s/I2nbzD2QqSYgahI2jLjYTQ
批训练、注意力模型及其声纹分割应用,谷歌三篇论文揭示其声纹识别技术原理
https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650750181&idx=5&sn=96d85740cb3d696cd2833f35f7908a6b
只对你有感觉:谷歌用声纹识别实现定向人声分离
https://mp.weixin.qq.com/s/Cfk3639bCy55qQj4HM2HWw
人工智能老司机带你认识声音黑科技:声纹识别
https://mp.weixin.qq.com/s/XUHS4o2G-iGuV9uuOmfBdQ
为什么在说话人识别技术中,PLDA面对神经网络依然坚挺?
https://mp.weixin.qq.com/s/bgIJMRZ64En3xMk3IGK-Vw
如何基于迁移学习快速识别出讲话的人是谁?
https://mp.weixin.qq.com/s/I2XU9u28S6LFoTY4kizoqw
清华大学郑方:语音技术与身份信息的隐私保护
https://mp.weixin.qq.com/s/YOupCjU06JhRCZNCbMvAgQ
Google开源新AI模型,语音区分准确率92%创新高
https://mp.weixin.qq.com/s/Cx066B8MCnkl4XY1f2AbbA
NIST评测(SRE19)获胜团队声纹识别技术分析
https://mp.weixin.qq.com/s/buTWsIPPmx9npt6MxSo7EQ
解锁声纹技术中的说话人日志
https://mp.weixin.qq.com/s/uvoj64TVEOP0E3pWV-DkfQ
attention在声纹识别中的应用
https://mp.weixin.qq.com/s/tl6D_A-SuUj_W76yu_pvkg
声纹识别助力身份认证
https://mp.weixin.qq.com/s/QuWKW3Hl8kho9RvHcn-uLQ
声纹分割聚类(Speaker Diarization)概要
https://zhuanlan.zhihu.com/p/22722073
当我谈汽车声学时,我在谈什么(一)
https://zhuanlan.zhihu.com/p/28608243
当我谈汽车声学时,我在谈什么(二)
https://zhuanlan.zhihu.com/p/31240294
当我谈汽车声学时,我在谈什么(三)
https://zhuanlan.zhihu.com/p/34256635
当我谈汽车声学时,我在谈什么(四)
ASR参考资源
https://zhuanlan.zhihu.com/p/40329331
谈谈语音识别与人声的物理原理,以及真声假声头声混声等概念
https://mp.weixin.qq.com/s/CjWNZf225OELIBoWRAbakg
全面了解什么是语音交互
https://mp.weixin.qq.com/s/NZUOy4KOL-19fGxC8JHYGw
语音识别系列之决策树
https://mp.weixin.qq.com/s/FsZqX-Uwk1-ciXTH_vCNng
声学发展史之——超声:寻找杰克,始于泰坦尼克号
https://mp.weixin.qq.com/s/_v-H1eapsBshp-sl7KHh2A
盘点欧洲知名声学实验室
https://mp.weixin.qq.com/s/iS0bz8w9qrKCrQIO2PFN6Q
关于主动降噪耳机,你想知道的一切(一)
https://mp.weixin.qq.com/s/BZMvDn4_mlaoV8m1DqT85A
关于主动降噪耳机,你想知道的一切(二):前馈自适应
https://mp.weixin.qq.com/s/2tq8tMnMGbNfe_javn07Eg
关于主动降噪耳机,你想知道的一切(三)
https://mp.weixin.qq.com/s/jJZ-Gx4cush3We_Nsmo4CA
关于主动降噪耳机,你想知道的一切(四)
https://mp.weixin.qq.com/s/qJS3cyWloNrON5-wCTXucw
关于主动降噪耳机,你想知道的一切(五)
https://mp.weixin.qq.com/s/PXSsMyWeUCOxrzX-5wkp5g
什么是音色?
https://mp.weixin.qq.com/s/BJshUILPcX-xA6ayn8J4oA
听音识瓜:怎样挑选一个好的西瓜?
https://mp.weixin.qq.com/s/hParUanfg0JxagE5Qk0VYQ
噪声控制简史,以及几个简单的声学概念
https://mp.weixin.qq.com/s/6KBQ9CzyMcUPiJTppI5eFQ
耳朵的进化
https://mp.weixin.qq.com/s/J11lDgGsYXLgT7jXmRQtAA
地球上最先进的麦克风,居是苍蝇耳朵
Machine Learning之Python篇++
https://mp.weixin.qq.com/s/-s5K8gl4Xdjh_1xgTn9PZg
维基百科中的数据科学:手把手教你用Python读懂全球最大百科全书
https://mp.weixin.qq.com/s/LiilfmvA5YUaY3QUQD6odA
如何用Python将数据预处理速度提升2至6倍?
https://mp.weixin.qq.com/s/4s7lDKlQjV1mUoVv558Y7Q
面向云数据库,超低延迟文件系统PolarFS诞生了
https://mp.weixin.qq.com/s/VfmudolvWzQN4ghgnI2rZA
机器学习中Python库的3个简单实践——你的图片将由你来创造
https://mp.weixin.qq.com/s/goxciguoxcamTo2WyUd1Lg
大吉大利,今晚如何用Python解锁“吃鸡”的正确姿势
https://mp.weixin.qq.com/s/dQ75O2h1orGzKcaCSDWshQ
自然语言处理是如何工作的?一步步教你构建NLP流水线
https://mp.weixin.qq.com/s/dwxTla5iiYKvELrpbWf1yQ
8个Python高效数据分析的技巧
https://mp.weixin.qq.com/s/TYiqZvY25qxHcmEXRpqO5Q
如何用Python做自动化特征工程
https://mp.weixin.qq.com/s/lfkTryraR22INdPzR0sidg
基于协同过滤的推荐系统实战
https://mp.weixin.qq.com/s/n3gaWuJCt945ycmliJatpA
python语音识别指南终极版
https://mp.weixin.qq.com/s/pDTbiS8xFH0llUBaN1Mb_Q
如何用Python写一个贪吃蛇AI
https://mp.weixin.qq.com/s/WdYa7Q-yA-s_EO59YkYbqw
7个基本机器学习算法Python实现
https://mp.weixin.qq.com/s/EqLzNzzMcwq5SEyBoTsuug
11种NLP文本预处理Python代码,简洁实用
https://mp.weixin.qq.com/s/mCUdK4i6XGEyaWNCIWA-wQ
集五福,我用Python
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK