multi_news

  • विवरण :

बहु-समाचार, साइट newser.com से इन लेखों के समाचार लेख और मानव-लिखित सारांश शामिल हैं। प्रत्येक सारांश पेशेवर रूप से संपादकों द्वारा लिखा गया है और इसमें उद्धृत मूल लेखों के लिंक शामिल हैं।

दो विशेषताएं हैं: - दस्तावेज़: विशेष टोकन "|||||" द्वारा अलग किए गए समाचार लेखों का पाठ। - सारांश: समाचार सारांश।

विभाजित करना उदाहरण
'test' 5,622
'train' 44,972
'validation' 5,622
  • फ़ीचर संरचना :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
दस्तावेज़ मूलपाठ डोरी
सारांश मूलपाठ डोरी
  • उद्धरण :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}