למבאדה

 • תיאור:

מערך הנתונים של LAMBADA מעריך את היכולות של מודלים חישוביים להבנת טקסט באמצעות משימה לחיזוי מילים. LAMBADA הוא אוסף קטעים נרטיביים החולקים את המאפיין כי נושאים אנושיים מסוגלים לנחש את המילה האחרונה שלהם אם הם נחשפים לכל הקטע, אך לא אם הם רואים רק את המשפט האחרון שקדם למילת המטרה.

לְפַצֵל דוגמאות
'test' 5,153
'train' 4,869
 • מאפיינים:
FeaturesDict({
  'passage': Text(shape=(), dtype=tf.string),
})
 • ציטוט:
@inproceedings{paperno-etal-2016-lambada,
  title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
  author = "Paperno, Denis and
   Kruszewski, Germ{'a}n and
   Lazaridou, Angeliki and
   Pham, Ngoc Quan and
   Bernardi, Raffaella and
   Pezzelle, Sandro and
   Baroni, Marco and
   Boleda, Gemma and
   Fern{'a}ndez, Raquel",
  booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
  month = aug,
  year = "2016",
  address = "Berlin, Germany",
  publisher = "Association for Computational Linguistics",
  url = "https://www.aclweb.org/anthology/P16-1144",
  doi = "10.18653/v1/P16-1144",
  pages = "1525--1534",
}