スキャン

  • 説明

さまざまな分割でタスクをスキャンします。

SCANは、構図学習とゼロショット一般化を研究するための単純な言語駆動型ナビゲーションタスクのセットです。

ほとんどの分割が詳細に説明されていhttps://github.com/brendenlake/SCAN MCD分割を参照してくださいについてhttps://arxiv.org/abs/1912.09713.pdf

基本的な使用法:

data = tfds.load('scan/length')

より高度な例:

data = tfds.load(
    'scan',
    builder_kwargs=dict(
        config=tfds.text.ScanConfig(
            name='simple_p8', directory='simple_split/size_variations')))
FeaturesDict({
    'actions': Text(shape=(), dtype=tf.string),
    'commands': Text(shape=(), dtype=tf.string),
})
@inproceedings{Lake2018GeneralizationWS,
  title={Generalization without Systematicity: On the Compositional Skills of
         Sequence-to-Sequence Recurrent Networks},
  author={Brenden M. Lake and Marco Baroni},
  booktitle={ICML},
  year={2018},
  url={https://arxiv.org/pdf/1711.00350.pdf},
}
@inproceedings{Keysers2020,
  title={Measuring Compositional Generalization: A Comprehensive Method on
         Realistic Data},
  author={Daniel Keysers and Nathanael Sch"{a}rli and Nathan Scales and
          Hylke Buisman and Daniel Furrer and Sergii Kashubin and
          Nikola Momchev and Danila Sinopalnikov and Lukasz Stafiniak and
          Tibor Tihon and Dmitry Tsarkov and Xiao Wang and Marc van Zee and
          Olivier Bousquet},
  note={Additional citation for MCD splits},
  booktitle={ICLR},
  year={2020},
  url={https://arxiv.org/abs/1912.09713.pdf},
}

スキャン/シンプル(デフォルト設定)

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ4.47 MiB

  • スプリット

スプリット
'test' 4,182
'train' 16,728

scan / addprim_jump

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ4.53 MiB

  • スプリット

スプリット
'test' 7,706
'train' 14,670

scan / addprim_turn_left

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ4.58 MiB

  • スプリット

スプリット
'test' 1,208
'train' 21,890

scan / filler_num0

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ3.20 MiB

  • スプリット

スプリット
'test' 1,173
'train' 15,225

scan / filler_num1

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ3.51 MiB

  • スプリット

スプリット
'test' 1,173
'train' 16,290

scan / filler_num2

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ3.84 MiB

  • スプリット

スプリット
'test' 1,173
'train' 17,391

scan / filler_num3

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ4.17 MiB

  • スプリット

スプリット
'test' 1,173
'train' 18,528

スキャン/長さ

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ4.47 MiB

  • スプリット

スプリット
'test' 3,920
'train' 16,990

scan / template_around_right

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ4.17 MiB

  • スプリット

スプリット
'test' 4,476
'train' 15,225

scan / template_jump_around_right

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ4.17 MiB

  • スプリット

スプリット
'test' 1,173
'train' 18,528

scan / template_opposite_right

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ4.22 MiB

  • スプリット

スプリット
'test' 4,476
'train' 15,225

scan / template_right

  • ダウンロードサイズ17.82 MiB

  • データセットサイズ4.26 MiB

  • スプリット

スプリット
'test' 4,476
'train' 15,225

scan / mcd1

  • ダウンロードサイズ17.89 MiB

  • データセットサイズ1.89 MiB

  • スプリット

スプリット
'test' 1,045
'train' 8,365

scan / mcd2

  • ダウンロードサイズ17.89 MiB

  • データセットサイズ1.84 MiB

  • スプリット

スプリット
'test' 1,045
'train' 8,365

scan / mcd3

  • ダウンロードサイズ17.89 MiB

  • データセットサイズ1.87 MiB

  • スプリット

スプリット
'test' 1,045
'train' 8,365