एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

multi_news

  • विवरण:

बहु-समाचार, समाचार लेख और साइट newser.com से इन लेखों के मानव-लिखित सारांश शामिल हैं। प्रत्येक सारांश पेशेवर रूप से संपादकों द्वारा लिखा गया है और इसमें उद्धृत मूल लेखों के लिंक शामिल हैं।

दो विशेषताएं हैं: - दस्तावेज़: विशेष टोकन "|||||" द्वारा अलग किए गए समाचार लेखों का पाठ। - सारांश: समाचार सारांश।

विभाजित करना उदाहरण
'test' 5,622
'train' 44,972
'validation' 5,622
  • विशेषताएं:
FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
  • प्रशस्ति पत्र:
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}