ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

xsum

  • รายละเอียด:

Extreme Summarization (XSum) ชุดข้อมูล

มีสองคุณสมบัติ: - เอกสาร: ป้อนบทความข่าว - สรุป: สรุปหนึ่งประโยคของบทความ

จำเป็นต้องใช้ข้อมูลนี้เพื่อดาวน์โหลด manaully และสกัดที่อธิบายไว้ใน https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md จำเป็นที่ 'ดาวน์โหลด xsum-สารสกัดจาก' โฟลเดอร์ที่ถูกบีบอัดเป็น 'xsum-extracts-from-downloads.tar.gz' และใส่ในโฟลเดอร์ที่ดาวน์โหลดด้วยตนเอง

  • โฮมเพจ: https://github.com/EdinburghNLP/XSum/tree/master/XSum-Dataset

  • รหัสที่มา: tfds.summarization.Xsum

  • รุ่น:

    • 1.0.0 : ชุดข้อมูลโดยไม่ต้องทำความสะอาด
    • 1.1.0 (เริ่มต้น): การเอาเนื้อหาเว็บ
  • ขนาดการดาวน์โหลด: 2.59 MiB

  • ขนาดชุด: Unknown size

  • คำแนะนำการดาวน์โหลดคู่มือ: ชุดนี้คุณจะต้องดาวน์โหลดข้อมูลแหล่งที่มาของตนเองลงใน download_config.manual_dir (ค่าเริ่มต้น ~/tensorflow_datasets/downloads/manual/ ):
    คำแนะนำการดาวน์โหลดรายละเอียด (ซึ่งต้องใช้สคริปต์ที่กำหนดเอง) อยู่ที่นี่: https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md#running-the-download-and-extraction-scripts หลังจากนั้น โปรดใส่ไฟล์ xsum-extracts-from-downloads.tar.gz ใน manual_dir

  • ออโต้แคช ( เอกสาร ): ไม่ทราบ

  • แยก:

แยก ตัวอย่าง
'test' 11,301
'train' 203,577
'validation' 11,305
  • คุณสมบัติ:
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • อ้างอิง:
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}