ランバダ

  • 説明

LAMBADAデータセットは、単語予測タスクを使用して、テキストを理解するための計算モデルの機能を評価します。ランバダは、人間の被験者がパッセージ全体にさらされた場合に最後の単語を推測できるが、ターゲット単語の前の最後の文だけを見た場合には推測できないという特徴を共有する物語のパッセージのコレクションです

スプリット
'test' 5,153
'train' 4,869
  • 特長
FeaturesDict({
    'passage': Text(shape=(), dtype=tf.string),
})
  • 引用
@inproceedings{paperno-etal-2016-lambada,
    title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
    author = "Paperno, Denis  and
      Kruszewski, Germ{'a}n  and
      Lazaridou, Angeliki  and
      Pham, Ngoc Quan  and
      Bernardi, Raffaella  and
      Pezzelle, Sandro  and
      Baroni, Marco  and
      Boleda, Gemma  and
      Fern{'a}ndez, Raquel",
    booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = aug,
    year = "2016",
    address = "Berlin, Germany",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P16-1144",
    doi = "10.18653/v1/P16-1144",
    pages = "1525--1534",
}