למבדה

  • תיאור :

מערך הנתונים של LAMBADA מעריך את היכולות של מודלים חישוביים להבנת טקסט באמצעות משימת חיזוי מילים. LAMBADA הוא אוסף של קטעים נרטיביים החולקים את המאפיין שסובייקטים אנושיים מסוגלים לנחש את המילה האחרונה שלהם אם הם נחשפים לכל הקטע, אבל לא אם הם רואים רק את המשפט האחרון שלפני מילת המטרה

לְפַצֵל דוגמאות
'test' 5,153
'train' 4,869
  • מבנה תכונה :
FeaturesDict({
    'passage': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
מַעֲבָר טֶקסט חוּט
  • ציטוט :
@inproceedings{paperno-etal-2016-lambada,
    title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
    author = "Paperno, Denis  and
      Kruszewski, Germ{\'a}n  and
      Lazaridou, Angeliki  and
      Pham, Ngoc Quan  and
      Bernardi, Raffaella  and
      Pezzelle, Sandro  and
      Baroni, Marco  and
      Boleda, Gemma  and
      Fern{\'a}ndez, Raquel",
    booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = aug,
    year = "2016",
    address = "Berlin, Germany",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P16-1144",
    doi = "10.18653/v1/P16-1144",
    pages = "1525--1534",
}