ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

cnn_dailymail

 • รายละเอียด:

CNN/DailyMail ชุดข้อมูลสรุปที่ไม่ระบุชื่อ

มีสองลักษณะคือ: - บทความ: ข้อความของบทความข่าวใช้เป็นเอกสารที่จะสรุป - ไฮไลท์: ข้อความเข้าร่วมในไฮไลท์ที่มีและแต่ละรอบไฮไลท์ซึ่งเป็นบทสรุปเป้าหมาย

 • โฮมเพจ: https://github.com/abisee/cnn-dailymail

 • รหัสที่มา: tfds.summarization.CnnDailymail

 • รุ่น:

  • 1.0.0 : แยก API ใหม่ ( https://tensorflow.org/datasets/splits )
  • 2.0.0 : ประโยคเป้าหมายเฉพาะกิจการที่มีการขึ้นบรรทัดใหม่ (การให้โมเดลทำนายตัวคั่นขึ้นบรรทัดใหม่ช่วยให้ประเมินโดยใช้ ROUGE ระดับสรุปได้ง่ายขึ้น)

  • 3.0.0 : การใช้รุ่นดาด

  • 3.1.0 : ถูกลบออก BuilderConfig

  • 3.2.0 (เริ่มต้น) : เอาพื้นที่พิเศษก่อนที่ระยะเวลาเพิ่มประโยค สิ่งนี้ไม่ควรส่งผลกระทบต่อคะแนน ROUGE เนื่องจากเครื่องหมายวรรคตอนจะถูกลบออก

 • ขนาดการดาวน์โหลด: 558.32 MiB

 • ขนาดชุด: 1.27 GiB

 • ออโต้แคช ( เอกสาร ): ไม่มี

 • แยก:

แยก ตัวอย่าง
'test' 11,490
'train' 287,113
'validation' 13,368
 • คุณสมบัติ:
FeaturesDict({
  'article': Text(shape=(), dtype=tf.string),
  'highlights': Text(shape=(), dtype=tf.string),
})
 • อ้างอิง:
@article{DBLP:journals/corr/SeeLM17,
 author  = {Abigail See and
        Peter J. Liu and
        Christopher D. Manning},
 title   = {Get To The Point: Summarization with Pointer-Generator Networks},
 journal  = {CoRR},
 volume  = {abs/1704.04368},
 year   = {2017},
 url    = {http://arxiv.org/abs/1704.04368},
 archivePrefix = {arXiv},
 eprint  = {1704.04368},
 timestamp = {Mon, 13 Aug 2018 16:46:08 +0200},
 biburl  = {https://dblp.org/rec/bib/journals/corr/SeeLM17},
 bibsource = {dblp computer science bibliography, https://dblp.org}
}

@inproceedings{hermann2015teaching,
 title={Teaching machines to read and comprehend},
 author={Hermann, Karl Moritz and Kocisky, Tomas and Grefenstette, Edward and Espeholt, Lasse and Kay, Will and Suleyman, Mustafa and Blunsom, Phil},
 booktitle={Advances in neural information processing systems},
 pages={1693--1701},
 year={2015}
}