Google I / Oが5月18〜20日に戻ってきます。スペースを予約してスケジュールを作成する今すぐ登録する
このページは Cloud Translation API によって翻訳されました。
Switch to English

フリック

  • 説明

論文から:人気のハリウッド映画から5003枚の画像データセットを自動的に収集しました。画像は、30本の映画の10フレームごとに最先端の人物検出器を実行することによって取得されました。高い信頼度で検出された人々(約2万人の候補者)は、クラウドソーシングマーケットプレイスのAmazon Mechanical Turkに送られ、グラウンドトゥルースラベルを取得しました。各画像には、5人のターカーがそれぞれ0.01ドルで注釈を付け、10個の上半身の関節にラベルを付けました。外れ値の注釈に対してロバストであるように、各画像で5つの中央値のラベル付けが行われました。最後に、人が閉塞しているか、正面を向いていない場合、画像は手動で拒否されました。テスト用にデータの20%(1016画像)を確保しました。

スプリット
'test' 1,016
'train' 3,987
  • 特徴
FeaturesDict({
    'currframe': tf.float64,
    'image': Image(shape=(480, 720, 3), dtype=tf.uint8),
    'moviename': Text(shape=(), dtype=tf.string),
    'poselet_hit_idx': Sequence(tf.uint16),
    'torsobox': BBoxFeature(shape=(4,), dtype=tf.float32),
    'xcoords': Sequence(tf.float64),
    'ycoords': Sequence(tf.float64),
})
@inproceedings{modec13,
    title={MODEC: Multimodal Decomposable Models for Human Pose Estimation},
    author={Sapp, Benjamin and Taskar, Ben},
    booktitle={In Proc. CVPR},
    year={2013},
  }

flic / small(デフォルト設定)

  • 構成の説明:CVPR13MODECペーパーで使用されている5003の例を使用します。

  • ダウンロードサイズ286.35 MiB

  • tfds.show_examples ):

視覚化

フリック/フル

  • 構成の説明:より難しい例で構成されるFLICのスーパーセットである20928の例を使用します。

  • ダウンロードサイズ1.10 GiB

  • tfds.show_examples ):

視覚化