qasc

  • คำอธิบาย :

QASC เป็นชุดข้อมูลตอบคำถามโดยเน้นที่องค์ประกอบประโยค ประกอบด้วยคำถามแบบปรนัย 8 ทาง 9,980 ข้อเกี่ยวกับวิทยาศาสตร์ระดับประถมศึกษา (8,134 รถไฟ, 926 dev, 920 การทดสอบ) และมาพร้อมกับคลังข้อมูล 17 ล้านประโยค

แยก ตัวอย่าง
'test' 920
'train' 8,134
'validation' 926
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'answerKey': Text(shape=(), dtype=string),
    'choices': Sequence({
        'label': Text(shape=(), dtype=string),
        'text': Text(shape=(), dtype=string),
    }),
    'combinedfact': Text(shape=(), dtype=string),
    'fact1': Text(shape=(), dtype=string),
    'fact2': Text(shape=(), dtype=string),
    'formatted_question': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
คีย์คำตอบ ข้อความ สตริง
ทางเลือก ลำดับ
ตัวเลือก/ฉลาก ข้อความ สตริง
ตัวเลือก/ข้อความ ข้อความ สตริง
รวมข้อเท็จจริง ข้อความ สตริง
ข้อเท็จจริง1 ข้อความ สตริง
ข้อเท็จจริง2 ข้อความ สตริง
รูปแบบคำถาม ข้อความ สตริง
รหัส ข้อความ สตริง
คำถาม ข้อความ สตริง
  • การอ้างอิง :
@article{allenai:qasc,
      author    = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title     = {QASC: A Dataset for Question Answering via Sentence Composition},
      journal   = {arXiv:1910.11473v2},
      year      = {2020},
}