cfq

  • 説明

組成の一般化を測定するためのCFQデータセット(およびその分割)。

参照https://arxiv.org/abs/1912.09713.pdfを背景に。

検証セットについての注意:これはテスト・セットと同じ分布を持っており、私たちは、未知のテスト分布に対するモデルの組成一般化を測定することに興味があるので、我々はすべての調整が電車のサブセットに行われるべきであることを示唆していますセットのみ(ペーパーのセクション5.1を参照)。

使用例:

data = tfds.load('cfq/mcd1')
FeaturesDict({
    'query': Text(shape=(), dtype=tf.string),
    'question': Text(shape=(), dtype=tf.string),
})
@inproceedings{Keysers2020,
  title={Measuring Compositional Generalization: A Comprehensive Method on
         Realistic Data},
  author={Daniel Keysers and Nathanael Sch"{a}rli and Nathan Scales and
          Hylke Buisman and Daniel Furrer and Sergii Kashubin and
          Nikola Momchev and Danila Sinopalnikov and Lukasz Stafiniak and
          Tibor Tihon and Dmitry Tsarkov and Xiao Wang and Marc van Zee and
          Olivier Bousquet},
  booktitle={ICLR},
  year={2020},
  url={https://arxiv.org/abs/1912.09713.pdf},
}

cfq / mcd1(デフォルト設定)

  • データセットサイズ49.75 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / mcd2

  • データセットサイズ51.39 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / mcd3

  • データセットサイズ50.22 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / question_complexity_split

  • データセットサイズ52.81 MiB

  • スプリット

スプリット
'test' 10,340
'train' 98,999
'validation' 10,339

cfq / question_pattern_split

  • データセットサイズ52.81 MiB

  • スプリット

スプリット
'test' 11,909
'train' 95,654
'validation' 12,115

cfq / query_complexity_split

  • データセットサイズ52.81 MiB

  • スプリット

スプリット
'test' 9,512
'train' 100,654
'validation' 9,512

cfq / query_pattern_split

  • データセットサイズ52.81 MiB

  • スプリット

スプリット
'test' 12,589
'train' 94,600
'validation' 12,489

cfq / random_split

  • データセットサイズ52.81 MiB

  • スプリット

スプリット
'test' 11,967
'train' 95,744
'validation' 11,967

cfq / cd0_r1

  • データセットサイズ49.72 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0_r2

  • データセットサイズ49.45 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0_r3

  • データセットサイズ49.76 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0_r4

  • データセットサイズ50.04 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0_r5

  • データセットサイズ49.36 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0_r6

  • データセットサイズ49.36 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0_r7

  • データセットサイズ49.93 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0_r8

  • データセットサイズ48.58 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0_r9

  • データセットサイズ49.23 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.1_r1

  • データセットサイズ51.54 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.1_r2

  • データセットサイズ48.18 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.1_r3

  • データセットサイズ49.23 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.1_r4

  • データセットサイズ49.76 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.1_r5

  • データセットサイズ49.10 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.1_r6

  • データセットサイズ49.10 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.1_r7

  • データセットサイズ48.02 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.1_r8

  • データセットサイズ48.13 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.1_r9

  • データセットサイズ48.44 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.2_r1

  • データセットサイズ50.90 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.2_r2

  • データセットサイズ49.12 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.2_r3

  • データセットサイズ50.68 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.2_r4

  • データセットサイズ52.61 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.2_r5

  • データセットサイズ50.63 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.2_r6

  • データセットサイズ50.63 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.2_r7

  • データセットサイズ52.39 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.2_r8

  • データセットサイズ50.53 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.2_r9

  • データセットサイズ50.64 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.3_r1

  • データセットサイズ52.08 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.3_r2

  • データセットサイズ52.11 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.3_r3

  • データセットサイズ51.25 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.3_r4

  • データセットサイズ49.94 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.3_r5

  • データセットサイズ49.71 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.3_r6

  • データセットサイズ49.71 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.3_r7

  • データセットサイズ50.86 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.3_r8

  • データセットサイズ49.43 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.3_r9

  • データセットサイズ50.32 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.4_r1

  • データセットサイズ48.52 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.4_r2

  • データセットサイズ47.40 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.4_r3

  • データセットサイズ49.18 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.4_r4

  • データセットサイズ47.86 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.4_r5

  • データセットサイズ49.01 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.4_r6

  • データセットサイズ49.01 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.4_r7

  • データセットサイズ51.70 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.4_r8

  • データセットサイズ50.94 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.4_r9

  • データセットサイズ51.98 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.5_r1

  • データセットサイズ51.00 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.5_r2

  • データセットサイズ49.91 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.5_r3

  • データセットサイズ51.26 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.5_r4

  • データセットサイズ51.27 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.5_r5

  • データセットサイズ51.87 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.5_r6

  • データセットサイズ51.87 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.5_r7

  • データセットサイズ48.52 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.5_r8

  • データセットサイズ48.62 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.5_r9

  • データセットサイズ48.48 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.6_r1

  • データセットサイズ49.32 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.6_r2

  • データセットサイズ49.36 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.6_r3

  • データセットサイズ49.85 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.6_r4

  • データセットサイズ50.07 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.6_r5

  • データセットサイズ49.86 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.6_r6

  • データセットサイズ49.86 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.6_r7

  • データセットサイズ49.42 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.6_r8

  • データセットサイズ48.52 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd0.6_r9

  • データセットサイズ49.54 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd1_r1

  • データセットサイズ49.75 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd1_r2

  • データセットサイズ49.07 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd1_r3

  • データセットサイズ50.22 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd1_r4

  • データセットサイズ49.12 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd1_r5

  • データセットサイズ48.80 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd1_r6

  • データセットサイズ48.80 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd1_r7

  • データセットサイズ50.69 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd1_r8

  • データセットサイズ51.39 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968

cfq / cd1_r9

  • データセットサイズ49.94 MiB

  • スプリット

スプリット
'test' 11,968
'train' 95,743
'validation' 11,968