ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

cnn_dailymail

  • รายละเอียด:

CNN/DailyMail ชุดข้อมูลสรุปที่ไม่ระบุชื่อ

มีสองลักษณะคือ: - บทความ: ข้อความของบทความข่าวใช้เป็นเอกสารที่จะสรุป - ไฮไลท์: ข้อความเข้าร่วมในไฮไลท์ที่มีและแต่ละรอบไฮไลท์ซึ่งเป็นบทสรุปเป้าหมาย

  • โฮมเพจ: https://github.com/abisee/cnn-dailymail

  • รหัสที่มา: tfds.summarization.CnnDailymail

  • รุ่น:

    • 1.0.0 : แยก API ใหม่ ( https://tensorflow.org/datasets/splits )
    • 2.0.0 : ประโยคเป้าหมายเฉพาะกิจการที่มีการขึ้นบรรทัดใหม่ (การให้โมเดลทำนายตัวคั่นขึ้นบรรทัดใหม่ช่วยให้ประเมินโดยใช้ ROUGE ระดับสรุปได้ง่ายขึ้น)

    • 3.0.0 : การใช้รุ่นดาด

    • 3.1.0 : ถูกลบออก BuilderConfig

    • 3.2.0 (เริ่มต้น) : เอาพื้นที่พิเศษก่อนที่ระยะเวลาเพิ่มประโยค สิ่งนี้ไม่ควรส่งผลกระทบต่อคะแนน ROUGE เนื่องจากเครื่องหมายวรรคตอนจะถูกลบออก

  • ขนาดการดาวน์โหลด: 558.32 MiB

  • ขนาดชุด: 1.27 GiB

  • ออโต้แคช ( เอกสาร ): ไม่มี

  • แยก:

แยก ตัวอย่าง
'test' 11,490
'train' 287,113
'validation' 13,368
  • คุณสมบัติ:
FeaturesDict({
    'article': Text(shape=(), dtype=tf.string),
    'highlights': Text(shape=(), dtype=tf.string),
})
  • อ้างอิง:
@article{DBLP:journals/corr/SeeLM17,
  author    = {Abigail See and
               Peter J. Liu and
               Christopher D. Manning},
  title     = {Get To The Point: Summarization with Pointer-Generator Networks},
  journal   = {CoRR},
  volume    = {abs/1704.04368},
  year      = {2017},
  url       = {http://arxiv.org/abs/1704.04368},
  archivePrefix = {arXiv},
  eprint    = {1704.04368},
  timestamp = {Mon, 13 Aug 2018 16:46:08 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/SeeLM17},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

@inproceedings{hermann2015teaching,
  title={Teaching machines to read and comprehend},
  author={Hermann, Karl Moritz and Kocisky, Tomas and Grefenstette, Edward and Espeholt, Lasse and Kay, Will and Suleyman, Mustafa and Blunsom, Phil},
  booktitle={Advances in neural information processing systems},
  pages={1693--1701},
  year={2015}
}