维希特分布 (Wishart) 的分布密度

谢益辉 / 2006-03-12

这是伟大的 SEM 工程之 ——Wishart 分布篇！要用最大似然估计（ML）的话，目前似乎只有这一条路可走，今日强忍着看多元统计分析的书没吐出来，实在是佩服张尧庭老师，他简直不是人 —— 只能说是神 1…… 其中用到的高等代数证明我几乎一个都没看懂，汗如雨下。此分布由 Wishart 于 1928 年推导出来（因此我认为 Wishart 也不是人），据称有人就用这个时间作为多元统计分析的诞生时间，由此可见 Wishart 分布之牛 X。废话少说，言归正传：

首先定义一个矩阵 Xnxm=(xij) 的分布，X 的分布即其列向量一个个拼接起来形成的长向量的分布；若 X 是 n 阶对称矩阵，那么只需要取上三角（或下三角）部分组成长向量即可，此时

样本矩阵仍然是：

其中假定 y(i) 相互独立，且 y(i)~Nm(μi, V)，Y 的期望记作：

此时就可以给出 Wishart 分布的定义了。以下二式中，（1）式是非中心 Wishart 分布（τ≠0），（2）式是中心 Wishart 分布（τ=0）：

现隆重推出中心 Wishart 分布的密度函数：

注意当 A 不是正定阵时，f (A)=0，在 SEM 参数的最大似然估计中，似乎没看见对 A 的正定性的检验，这是目前我的一点小疑问。现在给出密度函数之后，可以顺便说说 SEM 参数最大似然估计的思路：首先将结构方程模型中的样本标准化（如果只是做 ML 那么事实上只需要中心化就可以了），使各个样品的均值为零，这一步其实就是为中心 Wishart 分布做准备（使得τ=0），那么现在容易证明 A 其实就是样本协方差阵 S。而 SEM 参数估计的关键工作（或者说目的）也就在于使理论推导出的协方差阵（Σ(θ)）与实际样本协方差阵 S 尽可能接近；理论协方差阵Σ(θ) 也就是上式密度函数中的 V，那么现在要做的就是知道了 S 来估计Σ(θ)，也即知道了 A 来估计 V，正好就顺路上了最大似然估计的 “贼船”，如果最大似然估计的原理忘了请参见尾注 2。还有一点需要提醒注意的是，最大似然估计本身并没有直接达到使Σ(θ) 与 S 尽量接近的目的，看估计的效果如何，还得在估计之后再对结果进行检验（拟合指数）。

我可以放话：世界上不容怀疑的事情只有两件 —— 一是太阳从东边升起；二是张尧庭老师是神。 ↩
最大似然估计法（Maximum Likelihood Estimation）：设 X1, X2, …, Xn 是来自总体 X~f(x; θ)（其中θ未知）的样本，而 x1, x2, …, xn 为样本值，使似然函数达到最大的称为参数θ的最大似然估计值。一般地，θ的最大似然估计值满足： ↩

← 荒唐的 CuteFTP Gemini Saga →

Disqus Utterances Preferences

维希特分布 (Wishart) 的分布密度

维希特分布 (Wishart) 的分布密度

谢益辉 / 2006-03-12

Recommend

统计计算与数学推导及逻辑分析

热锅上的猪头

噔噔噔…… 哎呀我的脚！

关于气煞人的 LaTeX 浮动

我是一只只只只只小鸟（可爱的童音）

赴德短期商务签证

关于网页的小笔记：Firefox、IE 和 JavaScript

继续光着脚丫子在校园溜达

三分之二运气

第一届靠谱厮奖：邱怡轩

About Joyk