Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

multi_news

 • opis:

Multi-News, składa się z artykułów prasowych i streszczenia tych artykułów napisanych przez człowieka z serwisu newser.com. Każde streszczenie jest profesjonalnie napisane przez redaktorów i zawiera linki do oryginalnych cytowanych artykułów.

Są dwie funkcje: - document: tekst artykułów z wiadomościami oddzielony specjalnym tokenem "|||||". - podsumowanie: podsumowanie wiadomości.

Podział Przykłady
'test' 5,622
'train' 44 972
'validation' 5,622
 • Cechy:
FeaturesDict({
  'document': Text(shape=(), dtype=tf.string),
  'summary': Text(shape=(), dtype=tf.string),
})
 • cytat:
@misc{alex2019multinews,
  title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
  author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
  year={2019},
  eprint={1906.01749},
  archivePrefix={arXiv},
  primaryClass={cs.CL}
}