Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

mlqa

  • Описание:

MLQA (многоязычный набор данных с ответами на вопросы) - это эталонный набор данных для оценки эффективности многоязычных ответов на вопросы. Набор данных состоит из 7 языков: арабского, немецкого, испанского, английского, хинди, вьетнамского, китайского.

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa / ar (конфигурация по умолчанию)

  • Описание конфигурации: MLQA «ар» DEV и тест расколы.

  • Dataset Размер: 9.27 MiB

  • расколы:

Расколоть Примеры
'test' 5,335
'validation' 517

mlqa / de

  • Описание Config: MLQA «де» DEV и испытаний расколы.

  • Dataset Размер: 5.06 MiB

  • расколы:

Расколоть Примеры
'test' 4,517
'validation' 512

mlqa / en

  • Описание Config: MLQA «ан» DEV и тест расколы.

  • Dataset Размер: 15.72 MiB

  • расколы:

Расколоть Примеры
'test' 11 590
'validation' 1,148

mlqa / es

  • Описание Config: MLQA «» Dev Е.С. и тест расколы.

  • Dataset Размер: 5.09 MiB

  • расколы:

Расколоть Примеры
'test' 5 253
'validation' 500

mlqa / hi

  • Описание Config: MLQA «привет» DEV и тест расколы.

  • Dataset Размер: 12.83 MiB

  • расколы:

Расколоть Примеры
'test' 4918
'validation' 507

mlqa / vi

  • Описание Config: MLQA 'VI' DEV и тест расколы.

  • Dataset Размер: 8.77 MiB

  • расколы:

Расколоть Примеры
'test' 5 495
'validation' 511

млка / ж

  • Описание Config: MLQA «ж» DEV и тест расколы.

  • Dataset Размер: 5.13 MiB

  • расколы:

Расколоть Примеры
'test' 5,137
'validation' 504