ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

ทีม

  • รายละเอียด:

Stanford Question Answering Dataset (SQuAD) คือชุดข้อมูลเพื่อความเข้าใจในการอ่าน ซึ่งประกอบด้วยคำถามจากกลุ่มคนทำงานในชุดบทความ Wikipedia โดยที่คำตอบของคำถามทุกข้อคือส่วนของข้อความหรือช่วง จากข้อความการอ่านที่เกี่ยวข้อง หรือคำถาม อาจจะตอบไม่ได้

  • โฮมเพจ: https://rajpurkar.github.io/SQuAD-explorer/

  • รหัสที่มา: tfds.question_answering.squad.Squad

  • รุ่น:

    • 3.0.0 (เริ่มต้น): การแก้ไขปัญหาที่มีขนาดเล็กจำนวนตัวอย่าง (19) ที่ครอบคลุมคำตอบจะ misaligned เนื่องจากบริบทการกำจัดพื้นที่สีขาว
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

  • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

  • อ้างอิง:

@article{2016arXiv160605250R,
       author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
                 Konstantin and {Liang}, Percy},
        title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
      journal = {arXiv e-prints},
         year = 2016,
          eid = {arXiv:1606.05250},
        pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
       eprint = {1606.05250},
}

Squad/v1.1 (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย Config: รุ่น 1.1.0 ของทีม

  • ขนาดการดาวน์โหลด: 33.51 MiB

  • ขนาดชุด: 94.06 MiB

  • ออโต้แคช ( เอกสาร ): ใช่

  • แยก:

แยก ตัวอย่าง
'train' 87,599
'validation' 10,570
  • คุณสมบัติ:
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

ทีม/v2.0

  • คำอธิบาย Config: รุ่น 2.0.0 ของทีม

  • ขนาดการดาวน์โหลด: 44.34 MiB

  • ขนาดชุด: 148.54 MiB

  • ออโต้แคช ( เอกสาร ): ใช่ (ตรวจสอบ) เฉพาะเมื่อ shuffle_files=False (รถไฟ)

  • แยก:

แยก ตัวอย่าง
'train' 130,319
'validation' 11,873
  • คุณสมบัติ:
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'is_impossible': tf.bool,
    'plausible_answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})