- תיאור :
מערך הנתונים של LAMBADA מעריך את היכולות של מודלים חישוביים להבנת טקסט באמצעות משימת חיזוי מילים. LAMBADA הוא אוסף של קטעים נרטיביים החולקים את המאפיין שסובייקטים אנושיים מסוגלים לנחש את המילה האחרונה שלהם אם הם נחשפים לכל הקטע, אבל לא אם הם רואים רק את המשפט האחרון שלפני מילת המטרה
תיעוד נוסף : חקור על ניירות עם קוד
קוד מקור :
tfds.datasets.lambada.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
319.03 MiB
גודל ערכת נתונים :
3.49 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 5,153 |
'train' | 4,869 |
- מבנה תכונה :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
מַעֲבָר | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}