xtreme_xnli

  • الوصف :

تحتوي مجموعة البيانات هذه على ترجمات آلية لـ MNLI إلى كل لغة من لغات XNLI. يتم توفير بيانات الترجمة بواسطة XTREME. لاحظ أن هذا يختلف عن البيانات المترجمة آليًا التي يوفرها ورق XNLI الأصلي.

انشق، مزق أمثلة
'train' 392570
  • هيكل الميزة :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
فرضية ترجمة لغة متغيرة
الفرضية / اللغة نص سلسلة
الفرضية / الترجمة نص سلسلة
ضع الكلمة المناسبة ClassLabel int64
فرضية ترجمة
فرضية / ar نص سلسلة
فرضية / bg نص سلسلة
فرضية / دي نص سلسلة
فرضية / el نص سلسلة
فرضية / en نص سلسلة
الفرضية / الخانات نص سلسلة
فرضية / الاب نص سلسلة
فرضية / مرحبا نص سلسلة
فرضية / ru نص سلسلة
فرضية / SW نص سلسلة
فرضية / عشر نص سلسلة
فرضية / tr نص سلسلة
فرضية / اور نص سلسلة
فرضية / سادسا نص سلسلة
فرضية / zh نص سلسلة
  • الاقتباس :
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}