语音信号处理倒谱分析声门激励和声道冲激

语音信号z(t)可以看作是声门激励信号x(t)和声道冲激响应y(t)的卷积：z(t)=x(t)∗y(t)

声门激励信号x(t)：发清音时（声带不振动，如拼音b p），为能量较小白噪声；发浊音时（声带振动，如拼音m n），为以基音周期为周期的冲激序列。

声道冲激响应y(t)：是一个双边衰减序列，值主要在[-25,25]内。

为了把这两个分开，我们要进行同态处理，将卷积变成相加，然后在变化后的域（倒频域）上±25内是y(t)，外是x(t)。

此处25原理未知，但和采样点有关。

同态处理指的是将非线性组合信号通过某种变换转换成线性组合信号，然后通过线性操作进行处理的方式。

z(t)=x(t)y(t)

这种相乘的非线性组合信号正常来说很难分开，可以先进行log运算转换成log⁡z(t)=log⁡x(t)+logy(t)。然后DFT到频域进行处理，然后再IDFT回来再进行个指数运算就能转换回来。
z(t)=x(t)∗y(t)

这种卷积的非线性组合信号也很难分开，时域卷积转到频域就是相乘Z(w)=X(w)Y(w)，然后和上面这种情况一样log⁡Z(w)=log⁡X(w)+log⁡Y(w)，再转回时域进行线性处理。之后要弄回来就是转频域，然后指数运算，然后转时域。

由于语音信号可视为声门激励信号和声道冲击响应的卷积，所以这个形式更常见。

下图(b)是卷积同态系统，先经过特征系统，再线性处理，最后逆特征系统。特征系统就是一个Z变换 -> log/e -> 逆Z变换的过程。

倒谱与复倒谱（Cepstrum）

考虑上一节的2情况，语音信号常常也是这样：z(t)=x(t)∗y(t)