एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

qasc

  • विवरण:

QASC वाक्य रचना पर ध्यान देने वाला एक प्रश्न-उत्तर देने वाला डेटासेट है। इसमें ग्रेड स्कूल साइंस (8,134 ट्रेन, 926 देव, 920 टेस्ट) के बारे में 9,980 8-तरफा बहुविकल्पीय प्रश्न हैं, और 17M वाक्यों के एक संग्रह के साथ आता है।

विभाजित करना उदाहरण
'test' 920
'train' 8,134
'validation' 926
  • विशेषताएं:
FeaturesDict({
    'answerKey': Text(shape=(), dtype=tf.string),
    'choices': Sequence({
        'label': Text(shape=(), dtype=tf.string),
        'text': Text(shape=(), dtype=tf.string),
    }),
    'combinedfact': Text(shape=(), dtype=tf.string),
    'fact1': Text(shape=(), dtype=tf.string),
    'fact2': Text(shape=(), dtype=tf.string),
    'formatted_question': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'question': Text(shape=(), dtype=tf.string),
})
  • प्रशस्ति पत्र:
@article{allenai:qasc,
      author    = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title     = {QASC: A Dataset for Question Answering via Sentence Composition},
      journal   = {arXiv:1910.11473v2},
      year      = {2020},
}