Эта страница была переведа с помощью Cloud Translation API.
Switch to English

openbookqa

  • Описание :

Набор данных содержит 5 957 вопросов с 4 вариантами ответов. Кроме того, они предоставляют 5167 общедоступных фактов, полученных из краудсорсинга, и расширенную версию вопросов для обучения / разработки / тестирования, где каждый вопрос связан с исходным основным фактом, оценкой человеческой точности, оценкой ясности и анонимностью краудработника Я БЫ.

Трещина Примеры
'test' 500
'train' 4957
'validation' 500
  • Особенности :
FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'clarity': tf.float32,
    'fact1': Text(shape=(), dtype=tf.string),
    'humanScore': tf.float32,
    'question': FeaturesDict({
        'choice_A': Text(shape=(), dtype=tf.string),
        'choice_B': Text(shape=(), dtype=tf.string),
        'choice_C': Text(shape=(), dtype=tf.string),
        'choice_D': Text(shape=(), dtype=tf.string),
        'stem': Text(shape=(), dtype=tf.string),
    }),
    'turkIdAnonymized': Text(shape=(), dtype=tf.string),
})
  • Контролируемые ключи (см. as_supervised doc ): ('question', 'answerKey')

  • Цитата :

@article{mihaylov2018can,
  title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal={arXiv preprint arXiv:1809.02789},
  year={2018}
}