لامبادا

 • توضیحات :

مجموعه داده LAMBADA قابلیت های مدل های محاسباتی را برای درک متن با استفاده از یک کار پیش بینی کلمه ارزیابی می کند. لامبادا مجموعه‌ای از قسمت‌های روایی است که این ویژگی را به اشتراک می‌گذارد که سوژه‌های انسانی در صورت قرار گرفتن در معرض کل قسمت می‌توانند آخرین کلمه خود را حدس بزنند، اما اگر فقط آخرین جمله قبل از کلمه مورد نظر را ببینند نه.

شکاف مثال ها
'test' 5,153
'train' 4,869
 • ساختار ویژگی :
FeaturesDict({
  'passage': Text(shape=(), dtype=string),
})
 • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
گذر متن رشته
 • نقل قول :
@inproceedings{paperno-etal-2016-lambada,
  title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
  author = "Paperno, Denis and
   Kruszewski, Germ{\'a}n and
   Lazaridou, Angeliki and
   Pham, Ngoc Quan and
   Bernardi, Raffaella and
   Pezzelle, Sandro and
   Baroni, Marco and
   Boleda, Gemma and
   Fern{\'a}ndez, Raquel",
  booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
  month = aug,
  year = "2016",
  address = "Berlin, Germany",
  publisher = "Association for Computational Linguistics",
  url = "https://www.aclweb.org/anthology/P16-1144",
  doi = "10.18653/v1/P16-1144",
  pages = "1525--1534",
}