Sintonize-se com as primeiras mulheres em ML Simpósio esta terça-feira 19 out às 9h PST Register now

mlqa

  • Descrição:

MLQA (Multilingual Question Answer Dataset) é um conjunto de dados de referência para avaliar o desempenho de respostas a perguntas multilíngues. O conjunto de dados consiste em 7 idiomas: árabe, alemão, espanhol, inglês, hindi, vietnamita, chinês.

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa / ar (configuração padrão)

  • A inscrição Config: MLQA 'ar' dev e splits teste.

  • Dataset tamanho: 9.27 MiB

  • desdobramentos:

Dividir Exemplos
'test' 5.335
'validation' 517

mlqa / de

  • A inscrição Config: MLQA 'de' dev e splits teste.

  • Dataset tamanho: 5.06 MiB

  • desdobramentos:

Dividir Exemplos
'test' 4.517
'validation' 512

mlqa / en

  • A inscrição Config: MLQA 'en' dev e splits teste.

  • Dataset tamanho: 15.72 MiB

  • desdobramentos:

Dividir Exemplos
'test' 11.590
'validation' 1.148

mlqa / es

  • A inscrição Config: dev e teste splits MLQA 'ES'.

  • Dataset tamanho: 5.09 MiB

  • desdobramentos:

Dividir Exemplos
'test' 5.253
'validation' 500

mlqa / oi

  • A inscrição Config: MLQA 'oi' dev e splits teste.

  • Dataset tamanho: 12.83 MiB

  • desdobramentos:

Dividir Exemplos
'test' 4.918
'validation' 507

mlqa / vi

  • A inscrição Config: MLQA 'vi' dev e splits teste.

  • Dataset tamanho: 8.77 MiB

  • desdobramentos:

Dividir Exemplos
'test' 5.495
'validation' 511

mlqa / zh

  • A inscrição Config: splits MLQA 'zh' dev e teste.

  • Conjunto de dados de tamanho: 5.13 MiB

  • desdobramentos:

Dividir Exemplos
'test' 5.137
'validation' 504