阅读文章The Riemannian Geometry of Deep Generative Models
名字挺吓人
文章信息
18年CVPR workshop,据说评价不高
作者来自盐湖城犹他大学和IBM
简单笔记
Background | Motivation | Targets/Contributions | 实验结论: |
---|---|---|---|
1. 假设实际复杂数据存在流形表示,高维数据在低维流形上有结构 | 1. 研究生成模型中,低维隐空间中流形可能的黎曼几何性质。真研究黎曼几何中的流形,一共三个算法,见表格下方所述 | 实际数据的流形非线性,接近0曲率 | |
2. 假设生成模型学习低维隐空间到高维数据空间的映射,即模型能利用低维隐空间参数化,映射到高维空间中的数据流形(生成器) | 2. 计算测地线,主要是点到流形距离 | 隐空间中的(线性路径)直线相当于流形上的测地线 | |
3. 沿流形path上切向量的平移(对应数据点的语义平移,generate analogies),path是啥我还不知道 |
表中提到的文章提出三个算法:
- geodesic interpolation between two points on the manifold
- parallel translation of a tangent vector along a path on the manifold
- geodesic shooting from an initial point and velocity on the manifold
问题:
- Chapter 2中有不少维度让我困惑,最多是D维像集微分同胚于d维隐空间?
- (4)式左边是E?
- 为什么(4)的近似可以直接在M上用范数?需要度量来导?有点像欧氏空间了,不知道能不能这样写
细节:
- 雅可比阵把隐空间中切向量映为像集中切向量,通过自动求导计算
- 数据空间诱导黎曼度量,提供内积
- 黎曼流形平坦,曲率为0,但不一定线性!
打
回头再更新,觉得这个文章写得很垃圾,前前后后花了一个星期推导。。。