4

语音信号处理 倒

 2 years ago
source link: https://blog.kamino.link/2022/04/06/%E8%AF%AD%E9%9F%B3%E4%BF%A1%E5%8F%B7%E5%A4%84%E7%90%86-%E5%80%92%E8%B0%B1/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

语音信号处理 倒谱分析声门激励和声道冲激

语音信号z(t)可以看作是声门激励信号x(t)和声道冲激响应y(t)的卷积:z(t)=x(t)∗y(t)

声门激励信号x(t):发清音时(声带不振动,如拼音b p),为能量较小白噪声;发浊音时(声带振动,如拼音m n),为以基音周期为周期的冲激序列。

声道冲激响应y(t):是一个双边衰减序列,值主要在[-25,25]内。

为了把这两个分开,我们要进行同态处理,将卷积变成相加,然后在变化后的域(倒频域)上±25内是y(t),外是x(t)。

此处25原理未知,但和采样点有关。

同态处理指的是将非线性组合信号通过某种变换转换成线性组合信号,然后通过线性操作进行处理的方式。

  1. z(t)=x(t)y(t)

    这种相乘的非线性组合信号正常来说很难分开,可以先进行log运算转换成log⁡z(t)=log⁡x(t)+logy(t)。然后DFT到频域进行处理,然后再IDFT回来再进行个指数运算就能转换回来。

  2. z(t)=x(t)∗y(t)

    这种卷积的非线性组合信号也很难分开,时域卷积转到频域就是相乘Z(w)=X(w)Y(w),然后和上面这种情况一样log⁡Z(w)=log⁡X(w)+log⁡Y(w),再转回时域进行线性处理。之后要弄回来就是转频域,然后指数运算,然后转时域。

    由于语音信号可视为声门激励信号和声道冲击响应的卷积,所以这个形式更常见。

    下图(b)是卷积同态系统,先经过特征系统,再线性处理,最后逆特征系统。特征系统就是一个Z变换 -> log/e -> 逆Z变换的过程。

倒谱与复倒谱(Cepstrum)

考虑上一节的2情况,语音信号常常也是这样:z(t)=x(t)∗y(t)

  • z(t)的复倒谱z^(t)就是进行Z变换后取对数然后再逆Z变换的结果,这个过程也叫做特征系统D∗[⋅]。
  • z(t)的倒谱z^(t)也差不多,就是在Z变换之后会取幅值,因为一般不注重相位信息。

倒谱法求语音信号共振峰


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK