- Описание:
Набор данных LAMBADA оценивает возможности вычислительных моделей для понимания текста с помощью задачи предсказания слов. ЛАМБАДА - это набор повествовательных отрывков, обладающих той характеристикой, что люди-субъекты могут угадывать свое последнее слово, если они просматривают весь отрывок, но не если они видят только последнее предложение, предшествующее целевому слову.
Домашняя страница: https://zenodo.org/record/2630551#.X4Xzn5NKjUI
Исходный код:
tfds.text.lambada.Lambada
Версии:
-
1.0.0
( по умолчанию): Первый выпуск.
-
Скачать Размер:
319.03 MiB
Dataset Размер:
3.49 MiB
Авто-кэшируются ( документация ): Да
расколы:
Расколоть | Примеры |
---|---|
'test' | 5 153 |
'train' | 4869 |
- Особенности:
FeaturesDict({
'passage': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):None
Рис ( tfds.show_examples ): Не поддерживается.
Примеры ( tfds.as_dataframe ):
- Образец цитирования:
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}