xtreme_xnli

  • विवरण :

इस डेटासेट में प्रत्येक XNLI भाषा में MNLI का मशीनी अनुवाद शामिल है। अनुवाद डेटा XTREME द्वारा प्रदान किया जाता है। ध्यान दें कि यह मूल XNLI पेपर द्वारा प्रदान किए गए मशीन अनुवादित डेटा से अलग है।

विभाजित करना उदाहरण
'train' 392,570
  • फ़ीचर संरचना :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
परिकल्पना अनुवाद परिवर्तनीय भाषाएं
परिकल्पना / भाषा मूलपाठ डोरी
परिकल्पना/अनुवाद मूलपाठ डोरी
लेबल क्लासलेबल int64
आधार अनुवाद
परिसर / ar मूलपाठ डोरी
परिसर / बीजी मूलपाठ डोरी
परिसर / डे मूलपाठ डोरी
परिसर/एल मूलपाठ डोरी
परिसर/एन मूलपाठ डोरी
परिसर/तों मूलपाठ डोरी
परिसर / एफआर मूलपाठ डोरी
परिसर/हाय मूलपाठ डोरी
परिसर/आर.यू मूलपाठ डोरी
परिसर / दप मूलपाठ डोरी
परिसर / वें मूलपाठ डोरी
परिसर / ट्र मूलपाठ डोरी
परिसर/उर मूलपाठ डोरी
परिसर/vi मूलपाठ डोरी
परिसर/झि मूलपाठ डोरी
  • उद्धरण :
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}