cfq

  • الوصف :

مجموعة بيانات CFQ (وتقسيمها) لقياس التعميم التركيبي.

راجع https://arxiv.org/abs/1912.09713.pdf للحصول على الخلفية.

ملاحظة حول مجموعة التحقق من الصحة: ​​نظرًا لأن لها نفس التوزيع مثل مجموعة الاختبار ونحن مهتمون بقياس التعميم التركيبي لنموذج فيما يتعلق بتوزيع اختبار غير معروف ، فإننا نقترح أن يتم إجراء أي ضبط على مجموعة فرعية من القطار مجموعة فقط (انظر القسم 5.1 من الورق).

استخدام المثال:

data = tfds.load('cfq/mcd1')
FeaturesDict({
    'query': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
استفسار نص سلسلة
سؤال نص سلسلة
@inproceedings{Keysers2020,
  title={Measuring Compositional Generalization: A Comprehensive Method on
         Realistic Data},
  author={Daniel Keysers and Nathanael Sch"{a}rli and Nathan Scales and
          Hylke Buisman and Daniel Furrer and Sergii Kashubin and
          Nikola Momchev and Danila Sinopalnikov and Lukasz Stafiniak and
          Tibor Tihon and Dmitry Tsarkov and Xiao Wang and Marc van Zee and
          Olivier Bousquet},
  booktitle={ICLR},
  year={2020},
  url={https://arxiv.org/abs/1912.09713.pdf},
}

cfq / mcd1 (التكوين الافتراضي)

  • حجم مجموعة البيانات : 49.75 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / mcd2

  • حجم مجموعة البيانات : 51.39 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

CFQ / mcd3

  • حجم مجموعة البيانات : 50.22 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / question_complexity_split

  • حجم مجموعة البيانات : 52.81 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 10،340
'train' 98،999
'validation' 10،339

cfq / question_pattern_split

  • حجم مجموعة البيانات : 52.81 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11909
'train' 95654
'validation' 12115

cfq / query_complexity_split

  • حجم مجموعة البيانات : 52.81 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 9512
'train' 100654
'validation' 9512

cfq / query_pattern_split

  • حجم مجموعة البيانات : 52.81 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 12.589
'train' 94600
'validation' 12،489

cfq / random_split

  • حجم مجموعة البيانات : 52.81 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.967
'train' 95744
'validation' 11.967

cfq / cd0_r1

  • حجم مجموعة البيانات : 49.72 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0_r2

  • حجم مجموعة البيانات : 49.45 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0_r3

  • حجم مجموعة البيانات : 49.76 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0_r4

  • حجم مجموعة البيانات : 50.04 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0_r5

  • حجم مجموعة البيانات : 49.36 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0_r6

  • حجم مجموعة البيانات : 49.36 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0_r7

  • حجم مجموعة البيانات : 49.93 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0_r8

  • حجم مجموعة البيانات : 48.58 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0_r9

  • حجم مجموعة البيانات : 49.23 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.1_r1

  • حجم مجموعة البيانات : 51.54 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.1_r2

  • حجم مجموعة البيانات : 48.18 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.1_r3

  • حجم مجموعة البيانات : 49.23 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.1_r4

  • حجم مجموعة البيانات : 49.76 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.1_r5

  • حجم مجموعة البيانات : 49.10 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.1_r6

  • حجم مجموعة البيانات : 49.10 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.1_r7

  • حجم مجموعة البيانات : 48.02 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.1_r8

  • حجم مجموعة البيانات : 48.13 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.1_r9

  • حجم مجموعة البيانات : 48.44 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.2_r1

  • حجم مجموعة البيانات : 50.90 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.2_r2

  • حجم مجموعة البيانات : 49.12 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.2_r3

  • حجم مجموعة البيانات : 50.68 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.2_r4

  • حجم مجموعة البيانات : 52.61 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.2_r5

  • حجم مجموعة البيانات : 50.63 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.2_r6

  • حجم مجموعة البيانات : 50.63 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.2_r7

  • حجم مجموعة البيانات : 52.39 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.2_r8

  • حجم مجموعة البيانات : 50.53 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.2_r9

  • حجم مجموعة البيانات : 50.64 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.3_r1

  • حجم مجموعة البيانات : 52.08 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.3_r2

  • حجم مجموعة البيانات : 52.11 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.3_r3

  • حجم مجموعة البيانات : 51.25 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.3_r4

  • حجم مجموعة البيانات : 49.94 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.3_r5

  • حجم مجموعة البيانات : 49.71 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.3_r6

  • حجم مجموعة البيانات : 49.71 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.3_r7

  • حجم مجموعة البيانات : 50.86 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.3_r8

  • حجم مجموعة البيانات : 49.43 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.3_r9

  • حجم مجموعة البيانات : 50.32 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.4_r1

  • حجم مجموعة البيانات : 48.52 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.4_r2

  • حجم مجموعة البيانات : 47.40 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.4_r3

  • حجم مجموعة البيانات : 49.18 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.4_r4

  • حجم مجموعة البيانات : 47.86 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.4_r5

  • حجم مجموعة البيانات : 49.01 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.4_r6

  • حجم مجموعة البيانات : 49.01 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.4_r7

  • حجم مجموعة البيانات : 51.70 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.4_r8

  • حجم مجموعة البيانات : 50.94 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.4_r9

  • حجم مجموعة البيانات : 51.98 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.5_r1

  • حجم مجموعة البيانات : 51.00 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.5_r2

  • حجم مجموعة البيانات : 49.91 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.5_r3

  • حجم مجموعة البيانات : 51.26 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.5_r4

  • حجم مجموعة البيانات : 51.27 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.5_r5

  • حجم مجموعة البيانات : 51.87 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.5_r6

  • حجم مجموعة البيانات : 51.87 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.5_r7

  • حجم مجموعة البيانات : 48.52 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.5_r8

  • حجم مجموعة البيانات : 48.62 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.5_r9

  • حجم مجموعة البيانات : 48.48 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.6_r1

  • حجم مجموعة البيانات : 49.32 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.6_r2

  • حجم مجموعة البيانات : 49.36 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.6_r3

  • حجم مجموعة البيانات : 49.85 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.6_r4

  • حجم مجموعة البيانات : 50.07 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.6_r5

  • حجم مجموعة البيانات : 49.86 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.6_r6

  • حجم مجموعة البيانات : 49.86 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.6_r7

  • حجم مجموعة البيانات : 49.42 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.6_r8

  • حجم مجموعة البيانات : 48.52 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd0.6_r9

  • حجم مجموعة البيانات : 49.54 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd1_r1

  • حجم مجموعة البيانات : 49.75 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd1_r2

  • حجم مجموعة البيانات : 49.07 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd1_r3

  • حجم مجموعة البيانات : 50.22 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd1_r4

  • حجم مجموعة البيانات : 49.12 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd1_r5

  • حجم مجموعة البيانات : 48.80 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd1_r6

  • حجم مجموعة البيانات : 48.80 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd1_r7

  • حجم مجموعة البيانات : 50.69 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd1_r8

  • حجم مجموعة البيانات : 51.39 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968

cfq / cd1_r9

  • حجم مجموعة البيانات : 49.94 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11.968
'train' 95743
'validation' 11.968