ランバダ

  • 説明:

LAMBADA データセットは、単語予測タスクによるテキスト理解のための計算モデルの機能を評価します。 LAMBADA は、人間の被験者が文章全体にさらされた場合に最後の単語を推測できるという特徴を共有する物語の文章のコレクションですが、ターゲット単語の前の最後の文だけを見た場合はそうではありません

スプリット
'test' 5,153
'train' 4,869
  • 機能構造:
FeaturesDict({
    'passage': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
通路文章ストリング
  • 引用
@inproceedings{paperno-etal-2016-lambada,
    title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
    author = "Paperno, Denis  and
      Kruszewski, Germ{\'a}n  and
      Lazaridou, Angeliki  and
      Pham, Ngoc Quan  and
      Bernardi, Raffaella  and
      Pezzelle, Sandro  and
      Baroni, Marco  and
      Boleda, Gemma  and
      Fern{\'a}ndez, Raquel",
    booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = aug,
    year = "2016",
    address = "Berlin, Germany",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P16-1144",
    doi = "10.18653/v1/P16-1144",
    pages = "1525--1534",
}