ספרום

 • תיאור:

BookSum: אוסף מערכי נתונים לסיכום סיפורי ארוך טווח

יישום זה תומך כיום רק בסיכומי ספרים ופרקים.

GitHub: https://github.com/salesforce/booksum

התיקייה הידנית צריכה להכיל את הספריות הבאות:

- `booksum/`
- `all_chapterized_books/`
 • Auto-במטמון ( תיעוד ): כן (מבחן, אימות), רק כאשר shuffle_files=False (הרכבת)

 • מאפיינים:

FeaturesDict({
  'document': Text(shape=(), dtype=tf.string),
  'summary': Text(shape=(), dtype=tf.string),
})
@article{kryscinski2021booksum,
   title={BookSum: A Collection of Datasets for Long-form Narrative Summarization},
   author={Wojciech Kry{'s}ci{'n}ski and Nazneen Rajani and Divyansh Agarwal and Caiming Xiong and Dragomir Radev},
   year={2021},
   eprint={2105.08209},
   archivePrefix={arXiv},
   primaryClass={cs.CL}
}

ספרום/ספר (הגדרת ברירת מחדל)

 • תיאור Config: סיכום ספר ברמה

 • מערך נתונים גודל: 208.81 MiB

 • פיצולים:

לְפַצֵל דוגמאות
'test' 46
'train' 312
'validation' 45

ספרום/פרק

 • תיאור Config: סיכום ברמת הפרק

 • מערך נתונים גודל: 216.71 MiB

 • פיצולים:

לְפַצֵל דוגמאות
'test' 1,083
'train' 6,524
'validation' 891