- توضیحات :
مجموعه داده LAMBADA با استفاده از یک کار پیش بینی کلمه ، قابلیت های مدل های محاسباتی را برای درک متن ارزیابی می کند. LAMBADA مجموعه ای از قسمت های داستانی است که دارای این ویژگی است که افراد در صورت قرار گرفتن در معرض کل متن قادر به حدس زدن آخرین کلمه خود هستند ، اما نه تنها در صورت مشاهده آخرین جمله قبل از کلمه مورد نظر
صفحه اصلی : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
کد منبع :
tfds.text.lambada.Lambada
نسخه ها :
-
1.0.0
(پیش فرض): نسخه اولیه.
-
حجم
319.03 MiB
:319.03 MiB
اندازه مجموعه داده :
3.49 MiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 5153 |
'train' | 4869 |
- ویژگی ها :
FeaturesDict({
'passage': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
نقل قول :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):