5

Distribution-Aware Coordinate Representation for Human Pose Estimation

 2 years ago
source link: https://senyang-ml.github.io/2019/11/02/distribution-aware/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Distribution-Aware Coordinate Representation for Human Pose Estimation

posted on 2019-11-02

在arxiv上看到了这篇论文 ,个人认为这是一个很有意思的工作, 利用用heatmap上的最大值以及其对应位置m, 来估计真实高斯分布均值位置μ. 这样的量化误差(下采样导致的量化最小单位误差)能够得到最大程度上的减轻.

论文实验验证了该方法比经验上的估计方法更准确.(取峰值到次峰值的1/4偏移处的位置,这个估计其实也是近似符合高斯分布了).

公式6一阶导

D′(x)|x=μ=∂PT∂x|x=μ=−Σ−1(x−μ)|x=μ=0

那么D′(x) 是一个和x 形状一样的向量, 然而在公式(7)对向量μ泰勒展开:

公式7,高斯分布均值μ处关于mm位置的二阶泰勒展开

P(μ)=P(m)+D′(m)(μ−m)+12(μ−m)TD′′(m)(μ−m)

中的第二项D′(m)(μ−m) 中的D′(m) 是不是应该加上转置,才能得到标量? 即 D′(m)T(μ−m)

泰勒展开公式

P(μ)=P(m)+D′(m)(μ−m)+12(μ−m)TD′′(m)(μ−m)

代入P(μ)和P(m)的高斯分布公式,即,将μ,m代入下面的式子,约掉常数项

P(x;μ,Σ)=ln⁡(G)=−ln⁡(2π)−12ln⁡(|Σ|)−12(x−μ)TΣ−1(x−μ)

0=−12(m−μ)⊤Σ−1(m−μ)+D′(m)⊤(μ−m)+12(μ−m)⊤D′′(m)(μ−m)−D′(m)⊤(μ−m)=(μ−m)⊤D′′(m)(μ−m)−D′(m)⊤=(μ−m)⊤D′′(m)−D′(m)⊤D′′(m)−1=(μ−m)⊤−D′′(m)−⊤D′(m)=μ−mμ=m−D′′(m)−⊤D′(m)

因为=-D′′(m)=-Σ−1,在论文中方差矩阵假设为对角阵(可逆)Σ=[σ200σ2] (因为xy方向独立), 这意味着D′′(m)=D′′(m)T, 所以

μ=m−D′′(m)−⊤D′(m)μ=m−D′′(m)−1D′(m)

补充一个细节:

上面的推导, 在第三个等式约掉(μ−m)的条件是假设μ不等于m, 所以下面的等式是更完备的推导: 0=−12(m−μ)⊤Σ−1(m−μ)+D′(m)⊤(μ−m)+12(μ−m)⊤D′′(m)(μ−m)−D′(m)⊤(μ−m)=(μ−m)⊤D′′(m)(μ−m)−D′(m)⊤D′′(m)−1(μ−m)=(μ−m)⊤(μ−m)0=[μ−m+D′′(m)−⊤D′(m)](μ−m)0=[μ−m+D′′(m)−1D′(m)](μ−m)

这个推导的建立在两个假设上面: (1) 下采样后得到的heatmap上面的取值, 被假设为服从真实关键点位置的高斯分布 (2) 二阶泰勒展开的近似

那么 μ=m−D′′(m)−1D′(m) 也包含了μ=m的可能, 因为

D′(m)=0⇔m在高斯分布的均值位置⇔μ=m

所以 μ=m−D′′(m)−1D′(m)是完备的

在ilovepose网站(赞!)上, 原作者也给出了关于公式的解释: http://www.ilovepose.cn/t/99


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK