Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

каск

  • Описание :

QASC — это набор данных для ответов на вопросы с упором на состав предложений. Он состоит из 9 980 вопросов с 8 вариантами ответов о школьных науках (8 134 обучающих, 926 разрабатываемых, 920 тестовых) и содержит 17 миллионов предложений.

Расколоть Примеры
'test' 920
'train' 8134
'validation' 926
  • Особенности :
FeaturesDict({
    'answerKey': Text(shape=(), dtype=tf.string),
    'choices': Sequence({
        'label': Text(shape=(), dtype=tf.string),
        'text': Text(shape=(), dtype=tf.string),
    }),
    'combinedfact': Text(shape=(), dtype=tf.string),
    'fact1': Text(shape=(), dtype=tf.string),
    'fact2': Text(shape=(), dtype=tf.string),
    'formatted_question': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'question': Text(shape=(), dtype=tf.string),
})
  • Цитата :
@article{allenai:qasc,
      author    = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title     = {QASC: A Dataset for Question Answering via Sentence Composition},
      journal   = {arXiv:1910.11473v2},
      year      = {2020},
}