5

维希特分布 (Wishart) 的分布密度

 3 years ago
source link: https://yihui.org/cn/2006/03/19-48-00/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

维希特分布 (Wishart) 的分布密度

谢益辉 / 2006-03-12


这是伟大的 SEM 工程之 ——Wishart 分布篇!要用最大似然估计(ML)的话,目前似乎只有这一条路可走,今日强忍着看多元统计分析的书没吐出来,实在是佩服张尧庭老师,他简直不是人 —— 只能说是神 1…… 其中用到的高等代数证明我几乎一个都没看懂,汗如雨下。此分布由 Wishart 于 1928 年推导出来(因此我认为 Wishart 也不是人),据称有人就用这个时间作为多元统计分析的诞生时间,由此可见 Wishart 分布之牛 X。废话少说,言归正传:

首先定义一个矩阵 Xnxm=(xij) 的分布,X 的分布即其列向量一个个拼接起来形成的长向量的分布;若 X 是 n 阶对称矩阵,那么只需要取上三角(或下三角)部分组成长向量即可,此时

样本矩阵仍然是:

其中假定 y(i) 相互独立,且 y(i)~Nm(μi, V),Y 的期望记作:

此时就可以给出 Wishart 分布的定义了。以下二式中,(1)式是非中心 Wishart 分布(τ≠0),(2)式是中心 Wishart 分布(τ=0):

现隆重推出中心 Wishart 分布的密度函数:

注意当 A 不是正定阵时,f (A)=0,在 SEM 参数的最大似然估计中,似乎没看见对 A 的正定性的检验,这是目前我的一点小疑问。现在给出密度函数之后,可以顺便说说 SEM 参数最大似然估计的思路:首先将结构方程模型中的样本标准化(如果只是做 ML 那么事实上只需要中心化就可以了),使各个样品的均值为零,这一步其实就是为中心 Wishart 分布做准备(使得τ=0),那么现在容易证明 A 其实就是样本协方差阵 S。而 SEM 参数估计的关键工作(或者说目的)也就在于使理论推导出的协方差阵(Σ(θ))与实际样本协方差阵 S 尽可能接近;理论协方差阵Σ(θ) 也就是上式密度函数中的 V,那么现在要做的就是知道了 S 来估计Σ(θ),也即知道了 A 来估计 V,正好就顺路上了最大似然估计的 “贼船”,如果最大似然估计的原理忘了请参见尾注 2。还有一点需要提醒注意的是,最大似然估计本身并没有直接达到使Σ(θ)S 尽量接近的目的,看估计的效果如何,还得在估计之后再对结果进行检验(拟合指数)。


  1. 我可以放话:世界上不容怀疑的事情只有两件 —— 一是太阳从东边升起;二是张尧庭老师是神。
  2. 最大似然估计法(Maximum Likelihood Estimation):设 X1, X2, …, Xn 是来自总体 X~f(x; θ)(其中θ未知)的样本,而 x1, x2, …, xn 为样本值,使似然函数 达到最大的称为参数θ的最大似然估计值。一般地,θ的最大似然估计值满足:

荒唐的 CuteFTP Gemini Saga

Disqus Utterances Preferences

© Yihui Xie 2005 - 2020

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK