ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

ai2_arc_with_ir

  • รายละเอียด:

ชุดข้อมูลใหม่ของคำถามวิทยาศาสตร์แบบปรนัยระดับประถมศึกษาของแท้จำนวน 7,787 ข้อ ได้รวบรวมไว้เพื่อสนับสนุนการวิจัยในการตอบคำถามขั้นสูง ชุดข้อมูลถูกแบ่งเป็นชุดท้าทายและชุดง่าย โดยชุดแรกมีเพียงคำถามที่ตอบไม่ถูกต้องโดยทั้งอัลกอริทึมที่ใช้การเรียกค้นข้อมูลและอัลกอริธึมการเกิดร่วมกันของคำ เรายังรวมคลังข้อมูลของประโยควิทยาศาสตร์มากกว่า 14 ล้านประโยคที่เกี่ยวข้องกับงาน และการนำแบบจำลองพื้นฐานทางประสาทสามแบบไปใช้สำหรับชุดข้อมูลนี้ เราวาง ARC เป็นความท้าทายต่อชุมชน

เมื่อเทียบกับชุดเดิมนี้จะเพิ่มประโยคบริบทที่ได้ผ่านการดึงข้อมูลในลักษณะเดียวกับที่ UnifiedQA (ดู: https://arxiv.org/abs/2005.00700 )

FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'choices': Sequence({
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
        'text': Text(shape=(), dtype=tf.string),
    }),
    'id': Text(shape=(), dtype=tf.string),
    'paragraph': Text(shape=(), dtype=tf.string),
    'question': Text(shape=(), dtype=tf.string),
})
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

  • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

  • อ้างอิง:

@article{allenai:arc,
      author    = {Peter Clark  and Isaac Cowhey and Oren Etzioni and Tushar Khot and
                    Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord},
      title     = {Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge},
      journal   = {arXiv:1803.05457v1},
      year      = {2018},
}
@article{2020unifiedqa,
    title={UnifiedQA: Crossing Format Boundaries With a Single QA System},
    author={D. Khashabi and S. Min and T. Khot and A. Sabhwaral and O. Tafjord and P. Clark and H. Hajishirzi},
    journal={arXiv preprint},
    year={2020}
}

ai2_arc_with_ir/ARC-Challenge-IR (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย Config: ความท้าทายชุด 2590 "ยาก" คำถาม (ที่ทั้งดึงและวิธีการร่วมเกิดล้มเหลวที่จะตอบได้อย่างถูกต้อง)

  • ขนาดชุด: 3.76 MiB

  • แยก:

แยก ตัวอย่าง
'test' 1,172
'train' 1,119
'validation' 299

ai2_arc_with_ir/ARC-Easy-IR

  • คำอธิบาย Config: ง่ายชุด 5197 คำถามสำหรับความท้าทาย ARC

  • ขนาดชุด: 7.49 MiB

  • แยก:

แยก ตัวอย่าง
'test' 2,376
'train' 2,251
'validation' 570