mlqa

  • Descripción :

MLQA (conjunto de datos de respuesta a preguntas multilingües) es un conjunto de datos de referencia para evaluar el rendimiento de respuesta a preguntas multilingües. El conjunto de datos consta de 7 idiomas: árabe, alemán, español, inglés, hindi, vietnamita, chino.

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
respuestas Secuencia
respuestas/answer_start Tensor tf.int32
respuestas/texto Texto tf.cadena
contexto Texto tf.cadena
identificación Tensor tf.cadena
pregunta Texto tf.cadena
título Texto tf.cadena
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (configuración predeterminada)

  • Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'ar'.

  • Tamaño del conjunto de datos : 9.27 MiB

  • Divisiones :

Separar Ejemplos
'test' 5,335
'validation' 517

mlqa/de

  • Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'de'.

  • Tamaño del conjunto de datos : 5.06 MiB

  • Divisiones :

Separar Ejemplos
'test' 4,517
'validation' 512

mlqa/es

  • Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'en'.

  • Tamaño del conjunto de datos : 15.72 MiB

  • Divisiones :

Separar Ejemplos
'test' 11,590
'validation' 1,148

mlqa/es

  • Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'es'.

  • Tamaño del conjunto de datos : 5.09 MiB

  • Divisiones :

Separar Ejemplos
'test' 5,253
'validation' 500

mlqa/hola

  • Descripción de la configuración : MLQA 'hi' dev y divisiones de prueba.

  • Tamaño del conjunto de datos : 12.83 MiB

  • Divisiones :

Separar Ejemplos
'test' 4,918
'validation' 507

mlqa/vi

  • Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'vi'.

  • Tamaño del conjunto de datos : 8.77 MiB

  • Divisiones :

Separar Ejemplos
'test' 5,495
'validation' 511

mlqa/zh

  • Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'zh'.

  • Tamaño del conjunto de datos : 5.13 MiB

  • Divisiones :

Separar Ejemplos
'test' 5,137
'validation' 504