09:00 पीएसटी पर एमएल संगोष्ठी इस मंगलवार, 19 अक्टूबर में पहले महिलाओं में ट्यून रजिस्टर अब

cnn_दैनिक मेल

  • विवरण:

सीएनएन/डेलीमेल गैर-अज्ञात सारांश डेटासेट।

-: दो विशेषताएं हैं लेख: समाचार लेख के पाठ, दस्तावेज़ के रूप में इस्तेमाल करने के लिए संक्षेप किया - पर प्रकाश डाला: के साथ और प्रत्येक प्रकाश डाला है, जो लक्ष्य सार है चारों ओर प्रकाश डाला में शामिल हो गए पाठ

  • होमपेज: https://github.com/abisee/cnn-dailymail

  • स्रोत कोड: tfds.summarization.CnnDailymail

  • संस्करण:

    • 1.0.0 : नई विभाजन एपीआई ( https://tensorflow.org/datasets/splits )
    • 2.0.0 : अलग लक्ष्य वाक्य न्यू लाइन के साथ। (मॉडल द्वारा न्यूलाइन विभाजकों की भविष्यवाणी करने से सारांश-स्तर ROUGE का उपयोग करके मूल्यांकन करना आसान हो जाता है।)

    • 3.0.0 : मामलों संस्करण का उपयोग करना।

    • 3.1.0 : निकाला BuilderConfig

    • 3.2.0 (डिफ़ॉल्ट) : जोड़ा सजा की अवधि से पहले अतिरिक्त स्थान निकालें। इससे ROUGE स्कोर प्रभावित नहीं होने चाहिए क्योंकि विराम चिह्न हटा दिए जाते हैं।

  • डाउनलोड का आकार: 558.32 MiB

  • डेटासेट का आकार: 1.27 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'test' 11,490
'train' २८७,११३
'validation' १३,३६८
  • विशेषताएं:
FeaturesDict({
    'article': Text(shape=(), dtype=tf.string),
    'highlights': Text(shape=(), dtype=tf.string),
})
  • प्रशस्ति पत्र:
@article{DBLP:journals/corr/SeeLM17,
  author    = {Abigail See and
               Peter J. Liu and
               Christopher D. Manning},
  title     = {Get To The Point: Summarization with Pointer-Generator Networks},
  journal   = {CoRR},
  volume    = {abs/1704.04368},
  year      = {2017},
  url       = {http://arxiv.org/abs/1704.04368},
  archivePrefix = {arXiv},
  eprint    = {1704.04368},
  timestamp = {Mon, 13 Aug 2018 16:46:08 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/SeeLM17},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

@inproceedings{hermann2015teaching,
  title={Teaching machines to read and comprehend},
  author={Hermann, Karl Moritz and Kocisky, Tomas and Grefenstette, Edward and Espeholt, Lasse and Kay, Will and Suleyman, Mustafa and Blunsom, Phil},
  booktitle={Advances in neural information processing systems},
  pages={1693--1701},
  year={2015}
}