xtreme_xnli

  • תיאור :

מערך נתונים זה מכיל תרגומים מכונה של MNLI לכל אחת משפות XNLI. נתוני התרגום מסופקים על ידי XTREME. שים לב שזה שונה מהנתונים המתורגמים למכונה שסופקו על ידי נייר XNLI המקורי.

לְפַצֵל דוגמאות
'train' 392,570
  • מבנה תכונה :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
הַשׁעָרָה TranslationVariableLanguages
השערה/שפה טֶקסט חוּט
השערה/תרגום טֶקסט חוּט
תווית ClassLabel int64
הַנָחַת יְסוֹד תִרגוּם
הנחת יסוד/אר טֶקסט חוּט
הנחת יסוד/בג טֶקסט חוּט
premise/de טֶקסט חוּט
הנחת יסוד/אל טֶקסט חוּט
premise/he טֶקסט חוּט
הנחת יסוד טֶקסט חוּט
premise/fr טֶקסט חוּט
הנחת יסוד/היי טֶקסט חוּט
premise/ru טֶקסט חוּט
הנחת יסוד / sw טֶקסט חוּט
הנחת יסוד/ה טֶקסט חוּט
הנחת יסוד/טר טֶקסט חוּט
הנחת יסוד/ur טֶקסט חוּט
הנחת יסוד/vi טֶקסט חוּט
premise/zh טֶקסט חוּט
  • ציטוט :
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}