Distribution-Aware Coordinate Representation for Human Pose Estimation

posted on 2019-11-02

在arxiv上看到了这篇论文 ,个人认为这是一个很有意思的工作, 利用用heatmap上的最大值以及其对应位置m, 来估计真实高斯分布均值位置μ. 这样的量化误差（下采样导致的量化最小单位误差）能够得到最大程度上的减轻．

论文实验验证了该方法比经验上的估计方法更准确.（取峰值到次峰值的１／４偏移处的位置，这个估计其实也是近似符合高斯分布了）.

公式６一阶导

D′(x)|x=μ=∂PT∂x|x=μ=−Σ−1(x−μ)|x=μ=0

那么D′(x) 是一个和x 形状一样的向量, 然而在公式(7)对向量μ泰勒展开:

公式７,高斯分布均值μ处关于ｍｍ位置的二阶泰勒展开

P(μ)=P(m)+D′(m)(μ−m)+12(μ−m)TD′′(m)(μ−m)

中的第二项D′(m)(μ−m) 中的D′(m) 是不是应该加上转置,才能得到标量? 即 D′(m)T(μ−m)

泰勒展开公式

P(μ)=P(m)+D′(m)(μ−m)+12(μ−m)TD′′(m)(μ−m)

代入P(μ)和P(m)的高斯分布公式，即，将μ,m代入下面的式子，约掉常数项

P(x;μ,Σ)=ln⁡(G)=−ln⁡(2π)−12ln⁡(|Σ|)−12(x−μ)TΣ−1(x−μ)

0=−12(m−μ)⊤Σ−1(m−μ)+D′(m)⊤(μ−m)+12(μ−m)⊤D′′(m)(μ−m)−D′(m)⊤(μ−m)=(μ−m)⊤D′′(m)(μ−m)−D′(m)⊤=(μ−m)⊤D′′(m)−D′(m)⊤D′′(m)−1=(μ−m)⊤−D′′(m)−⊤D′(m)=μ−mμ=m−D′′(m)−⊤D′(m)

因为＝－D′′(m)＝－Σ−1，在论文中方差矩阵假设为对角阵(可逆)Σ=[σ200σ2] (因为ｘｙ方向独立),　这意味着D′′(m)=D′′(m)T, 所以

μ=m−D′′(m)−⊤D′(m)μ=m−D′′(m)−1D′(m)

补充一个细节:

上面的推导, 在第三个等式约掉(μ−m)的条件是假设μ不等于m, 所以下面的等式是更完备的推导: 0=−12(m−μ)⊤Σ−1(m−μ)+D′(m)⊤(μ−m)+12(μ−m)⊤D′′(m)(μ−m)−D′(m)⊤(μ−m)=(μ−m)⊤D′′(m)(μ−m)−D′(m)⊤D′′(m)−1(μ−m)=(μ−m)⊤(μ−m)0=[μ−m+D′′(m)−⊤D′(m)](μ−m)0=[μ−m+D′′(m)−1D′(m)](μ−m)

这个推导的建立在两个假设上面: (1) 下采样后得到的heatmap上面的取值, 被假设为服从真实关键点位置的高斯分布 (2) 二阶泰勒展开的近似

那么 μ=m−D′′(m)−1D′(m) 也包含了μ=m的可能, 因为

D′(m)=0⇔m在高斯分布的均值位置⇔μ=m

所以 μ=m−D′′(m)−1D′(m)是完备的

在ilovepose网站(赞!)上, 原作者也给出了关于公式的解释: http://www.ilovepose.cn/t/99

Author： 杨森 & yangsenius
Link： http://senyang-ml.github.io/2019/11/02/distribution-aware/
License： Unless otherwise stated, all blogs use the CC BY-NC-SA 3.0 protocol, please indicate the source

Distribution-Aware Coordinate Representation for Human Pose Estimation

Distribution-Aware Coordinate Representation for Human Pose Estimation

Recommend

Stacked Capsule Autoencoders-堆叠的胶囊自编码器

Enhance Hexo Next

Bipartite Matching and Hungarian Algorithm

Detr

My Findings - CoordConv坐标嵌入技术及其泛化性

逆向投资大师邓普顿的长赢投资法：危机中寻找时机

不完整的Hgame2020-CTF的WP

SQL注入笔记

FLASK学习笔记-WIP

C语言实现学生信息管理系统

About Joyk