aflw2k3d

  • 説明

AFLW2000-3Dは、画像レベルの68ポイントの3D顔のランドマークで注釈が付けられた2000枚の画像のデータセットです。このデータセットは通常、3D顔のランドマーク検出モデルの評価に使用されます。頭のポーズは非常に多様であり、cnnベースの顔検出器で検出するのは難しいことがよくあります。元の論文で述べたように、一部のデータは21ポイントと一致していないため、このデータセットでは2Dランドマークはスキップされます。

スプリット
'train' 2,000
  • 特長
FeaturesDict({
    'image': Image(shape=(450, 450, 3), dtype=tf.uint8),
    'landmarks_68_3d_xy_normalized': Tensor(shape=(68, 2), dtype=tf.float32),
    'landmarks_68_3d_z': Tensor(shape=(68, 1), dtype=tf.float32),
})

視覚化

  • 引用
@article{DBLP:journals/corr/ZhuLLSL15,
  author    = {Xiangyu Zhu and
               Zhen Lei and
               Xiaoming Liu and
               Hailin Shi and
               Stan Z. Li},
  title     = {Face Alignment Across Large Poses: {A} 3D Solution},
  journal   = {CoRR},
  volume    = {abs/1511.07212},
  year      = {2015},
  url       = {http://arxiv.org/abs/1511.07212},
  archivePrefix = {arXiv},
  eprint    = {1511.07212},
  timestamp = {Mon, 13 Aug 2018 16:48:23 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/ZhuLLSL15},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}