ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

ai2_arc_with_ir

 • รายละเอียด:

ชุดข้อมูลใหม่ของคำถามวิทยาศาสตร์แบบปรนัยระดับประถมศึกษาของแท้จำนวน 7,787 ข้อ ได้รวบรวมไว้เพื่อสนับสนุนการวิจัยในการตอบคำถามขั้นสูง ชุดข้อมูลถูกแบ่งเป็นชุดท้าทายและชุดง่าย โดยชุดแรกมีเพียงคำถามที่ตอบไม่ถูกต้องโดยทั้งอัลกอริทึมที่ใช้การเรียกค้นข้อมูลและอัลกอริธึมการเกิดร่วมกันของคำ เรายังรวมคลังข้อมูลของประโยควิทยาศาสตร์มากกว่า 14 ล้านประโยคที่เกี่ยวข้องกับงาน และการนำแบบจำลองพื้นฐานทางประสาทสามแบบไปใช้สำหรับชุดข้อมูลนี้ เราวาง ARC เป็นความท้าทายต่อชุมชน

เมื่อเทียบกับชุดเดิมนี้จะเพิ่มประโยคบริบทที่ได้ผ่านการดึงข้อมูลในลักษณะเดียวกับที่ UnifiedQA (ดู: https://arxiv.org/abs/2005.00700 )

FeaturesDict({
  'answerKey': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
  'choices': Sequence({
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'text': Text(shape=(), dtype=tf.string),
  }),
  'id': Text(shape=(), dtype=tf.string),
  'paragraph': Text(shape=(), dtype=tf.string),
  'question': Text(shape=(), dtype=tf.string),
})
 • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

 • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

 • อ้างอิง:

@article{allenai:arc,
   author  = {Peter Clark and Isaac Cowhey and Oren Etzioni and Tushar Khot and
          Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord},
   title   = {Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge},
   journal  = {arXiv:1803.05457v1},
   year   = {2018},
}
@article{2020unifiedqa,
  title={UnifiedQA: Crossing Format Boundaries With a Single QA System},
  author={D. Khashabi and S. Min and T. Khot and A. Sabhwaral and O. Tafjord and P. Clark and H. Hajishirzi},
  journal={arXiv preprint},
  year={2020}
}

ai2_arc_with_ir/ARC-Challenge-IR (การกำหนดค่าเริ่มต้น)

 • คำอธิบาย Config: ความท้าทายชุด 2590 "ยาก" คำถาม (ที่ทั้งดึงและวิธีการร่วมเกิดล้มเหลวที่จะตอบได้อย่างถูกต้อง)

 • ขนาดชุด: 3.76 MiB

 • แยก:

แยก ตัวอย่าง
'test' 1,172
'train' 1,119
'validation' 299

ai2_arc_with_ir/ARC-Easy-IR

 • คำอธิบาย Config: ง่ายชุด 5197 คำถามสำหรับความท้าทาย ARC

 • ขนาดชุด: 7.49 MiB

 • แยก:

แยก ตัวอย่าง
'test' 2,376
'train' 2,251
'validation' 570