Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

książka

  • opis:

BookSum: zbiór zbiorów danych do długiego podsumowania narracyjnego

Ta implementacja obsługuje obecnie tylko podsumowania książek i rozdziałów.

GitHub: https://github.com/salesforce/booksum

Folder podręcznika powinien zawierać następujące katalogi:

- `booksum/`
- `all_chapterized_books/`
  • Auto-buforowane ( dokumentacja ) Tak (badanie, zatwierdzanie), jedynie gdy shuffle_files=False (pociąg)

  • Cechy:

FeaturesDict({
    'document': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
})
@article{kryscinski2021booksum,
      title={BookSum: A Collection of Datasets for Long-form Narrative Summarization},
      author={Wojciech Kry{'s}ci{'n}ski and Nazneen Rajani and Divyansh Agarwal and Caiming Xiong and Dragomir Radev},
      year={2021},
      eprint={2105.08209},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

suma ksiąg/książka (konfiguracja domyślna)

  • Opis config: Book-poziom podsumowania

  • Zbiór danych rozmiar: 208.81 MiB

  • dzieli:

Podział Przykłady
'test' 46
'train' 312
'validation' 45

księga/rozdział

  • Opis config: rozdział poziomu podsumowania

  • Zbiór danych rozmiar: 216.71 MiB

  • dzieli:

Podział Przykłady
'test' 1,083
'train' 6524
'validation' 891