xtreme_xnli

با مجموعه‌ها، منظم بمانید ذخیره و دسته‌بندی محتوا براساس اولویت‌های شما.

  • توضیحات :

این مجموعه داده شامل ترجمه ماشینی MNLI به هر یک از زبان های XNLI است. داده های ترجمه توسط XTREME ارائه شده است. توجه داشته باشید که این با داده های ترجمه شده ماشینی ارائه شده توسط کاغذ اصلی XNLI متفاوت است.

شکاف مثال ها
'train' 392,570
  • ساختار ویژگی :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
فرضیه TranslationVariableLanguages
فرضیه/زبان متن رشته
فرضیه/ترجمه متن رشته
برچسب ClassLabel int64
فرضیه ترجمه
مقدمه/ar متن رشته
مقدمه/bg متن رشته
مقدمه/د متن رشته
مقدمه/ال متن رشته
premise/en متن رشته
پیش فرض/ها متن رشته
premise/fr متن رشته
مقدمه/سلام متن رشته
premise/ru متن رشته
پیش فرض/سو متن رشته
مقدمه/ام متن رشته
premise/tr متن رشته
premise/ur متن رشته
premise/vi متن رشته
مقدمه/zh متن رشته
  • نقل قول :
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}