【论文略读29】深度生成模型的黎曼几何理论

阅读文章The Riemannian Geometry of Deep Generative Models

名字挺吓人

文章信息

  • 18年CVPR workshop,据说评价不高

  • 作者来自盐湖城犹他大学和IBM

简单笔记

Background Motivation Targets/Contributions 实验结论:
1. 假设实际复杂数据存在流形表示,高维数据在低维流形上有结构 1. 研究生成模型中,低维隐空间中流形可能的黎曼几何性质。真研究黎曼几何中的流形,一共三个算法,见表格下方所述 实际数据的流形非线性,接近0曲率
2. 假设生成模型学习低维隐空间到高维数据空间的映射,即模型能利用低维隐空间参数化,映射到高维空间中的数据流形(生成器) 2. 计算测地线,主要是点到流形距离 隐空间中的(线性路径)直线相当于流形上的测地线
3. 沿流形path上切向量的平移(对应数据点的语义平移,generate analogies),path是啥我还不知道

表中提到的文章提出三个算法:

  • geodesic interpolation between two points on the manifold
  • parallel translation of a tangent vector along a path on the manifold
  • geodesic shooting from an initial point and velocity on the manifold

问题:

  • Chapter 2中有不少维度让我困惑,最多是D维像集微分同胚于d维隐空间?
  • (4)式左边是E?
  • 为什么(4)的近似可以直接在M上用范数?需要度量来导?有点像欧氏空间了,不知道能不能这样写

细节:

  • 雅可比阵把隐空间中切向量映为像集中切向量,通过自动求导计算
  • 数据空间诱导黎曼度量,提供内积
  • 黎曼流形平坦,曲率为0,但不一定线性!


回头再更新,觉得这个文章写得很垃圾,前前后后花了一个星期推导。。。