ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

reddit_tifu

  • รายละเอียด:

ชุดข้อมูล Reddit โดยที่ TIFU หมายถึงชื่อ subbreddit /r/tifu ตามที่กำหนดไว้ในสิ่งพิมพ์ สไตล์ "สั้น" ใช้ชื่อเป็นการสรุป และ "ยาว" ใช้ tldr เป็นข้อมูลสรุป

คุณสมบัติรวมถึง: - เอกสาร: โพสต์ข้อความโดยไม่ต้อง tldr - tldr: เส้น tldr - ชื่อเรื่อง: หัวข้อที่ถูกตัดแต่งโดยไม่มี tldr - ups: upvotes - คะแนน: คะแนน - num_comments: จำนวนความคิดเห็น - upvote_ratio: อัตราส่วน upvote

  • โฮมเพจ: https://github.com/ctr4si/MMN

  • รหัสที่มา: tfds.summarization.RedditTifu

  • รุ่น:

    • 1.1.0 (เริ่มต้น): ไม่มีบันทึกประจำรุ่น
  • ขนาดการดาวน์โหลด: 639.54 MiB

  • ขนาดชุด: Unknown size

  • ออโต้แคช ( เอกสาร ): ไม่ทราบ

  • คุณสมบัติ:

FeaturesDict({
    'documents': Text(shape=(), dtype=tf.string),
    'num_comments': tf.float32,
    'score': tf.float32,
    'title': Text(shape=(), dtype=tf.string),
    'tldr': Text(shape=(), dtype=tf.string),
    'ups': tf.float32,
    'upvote_ratio': tf.float32,
})
  • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

  • อ้างอิง:

@misc{kim2018abstractive,
    title={Abstractive Summarization of Reddit Posts with Multi-level Memory Networks},
    author={Byeongchang Kim and Hyunwoo Kim and Gunhee Kim},
    year={2018},
    eprint={1811.00783},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

reddit_tifu/short (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย Config: การใช้ชื่อเป็นบทสรุป

  • แยก:

แยก ตัวอย่าง
'train' 79,740

reddit_tifu/long

  • คำอธิบาย Config: การใช้ TLDR สรุป

  • แยก:

แยก ตัวอย่าง
'train' 42,139