サムスン

  • 説明:

SAMSum Corpus には、手動で注釈が付けられた要約を含む 16,000 を超えるチャット ダイアログが含まれています。

次の 2 つの機能があります。

スプリット
'test' 819
'train' 14,732
'validation' 818
  • 機能構造:
FeaturesDict({
    'dialogue': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ダイアログ文章ストリング
ID文章ストリング
まとめ文章ストリング
  • 引用
@article{gliwa2019samsum,
  title={SAMSum Corpus: A Human-annotated Dialogue Dataset for Abstractive Summarization},
  author={Gliwa, Bogdan and Mochol, Iwona and Biesek, Maciej and Wawer, Aleksander},
  journal={arXiv preprint arXiv:1911.12237},
  year={2019}
}