xtreme_xnli

  • Descripción :

Este conjunto de datos contiene traducciones automáticas de MNLI a cada uno de los idiomas XNLI. Los datos de traducción son proporcionados por XTREME. Tenga en cuenta que esto es diferente de los datos traducidos automáticamente proporcionados por el documento XNLI original.

Separar Ejemplos
'train' 392,570
  • Estructura de características :
FeaturesDict({
    'hypothesis': TranslationVariableLanguages({
        'language': Text(shape=(), dtype=string),
        'translation': Text(shape=(), dtype=string),
    }),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Translation({
        'ar': Text(shape=(), dtype=string),
        'bg': Text(shape=(), dtype=string),
        'de': Text(shape=(), dtype=string),
        'el': Text(shape=(), dtype=string),
        'en': Text(shape=(), dtype=string),
        'es': Text(shape=(), dtype=string),
        'fr': Text(shape=(), dtype=string),
        'hi': Text(shape=(), dtype=string),
        'ru': Text(shape=(), dtype=string),
        'sw': Text(shape=(), dtype=string),
        'th': Text(shape=(), dtype=string),
        'tr': Text(shape=(), dtype=string),
        'ur': Text(shape=(), dtype=string),
        'vi': Text(shape=(), dtype=string),
        'zh': Text(shape=(), dtype=string),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
hipótesis TraducciónVariableIdiomas
hipótesis/lenguaje Texto cuerda
hipótesis/traducción Texto cuerda
etiqueta Etiqueta de clase int64
premisa Traducción
premisa/ar Texto cuerda
premisa/bg Texto cuerda
premisa/de Texto cuerda
premisa/el Texto cuerda
premisa/es Texto cuerda
premisa/s Texto cuerda
premisa/es Texto cuerda
premisa/hola Texto cuerda
premisa/ru Texto cuerda
premisa/sw Texto cuerda
premisa/th Texto cuerda
premisa/tr Texto cuerda
premisa/ur Texto cuerda
premisa/vi Texto cuerda
premisa/zh Texto cuerda
  • Cita :
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}