xsum

  • الوصف :

مجموعة بيانات التلخيص الشديد (XSum).

هناك ميزتان: - المستند: إدخال مقال إخباري. - الملخص: جملة واحدة ملخص المقال.

يجب تنزيل هذه البيانات واستخراجها يدويًا كما هو موضح في https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md يجب ضغط المجلد "xsum-extracts-from-downloads" 'xsum-extracts-from-downloads.tar.gz' وقم بوضعه في المجلد الذي تم تنزيله يدويًا.

انشق، مزق أمثلة
'test' 11301
'train' 203.577
'validation' 11305
  • هيكل الميزة :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
وثيقة نص سلسلة
ملخص نص سلسلة
  • الاقتباس :
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}