- Описание :
Данные содержат наборы от 1 до 7 троек в форме субъект-предикат-объект, извлеченные из (DBpedia) [ https://wiki.dbpedia.org/ ], и текст на естественном языке, который является вербализацией этих троек. Тестовые данные охватывают 15 различных доменов, из которых только 10 присутствуют в обучающих данных. Набор данных соответствует стандартизированному формату таблицы.
Домашняя страница : https://webnlg-challenge.loria.fr/challenge_2017/
Исходный код :
tfds.structured.web_nlg.WebNlg
Версии :
-
0.1.0
(по умолчанию): без примечаний к выпуску.
-
Размер загрузки :
19.76 MiB
Размер набора данных :
13.78 MiB
Автоматическое кэширование ( документация ): Да
Сплит :
Трещина | Примеры |
---|---|
'test_all' | 4928 |
'test_unseen' | 2,433 |
'train' | 18 102 |
'validation' | 2268 |
- Особенности :
FeaturesDict({
'input_text': FeaturesDict({
'context': tf.string,
'table': Sequence({
'column_header': tf.string,
'content': tf.string,
'row_number': tf.int16,
}),
}),
'target_text': tf.string,
})
Контролируемые ключи (см.
as_supervised
doc ):('input_text', 'target_text')
Цитата :
@inproceedings{gardent2017creating,
title = ""Creating Training Corpora for {NLG} Micro-Planners"",
author = ""Gardent, Claire and
Shimorina, Anastasia and
Narayan, Shashi and
Perez-Beltrachini, Laura"",
booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
month = jul,
year = ""2017"",
address = ""Vancouver, Canada"",
publisher = ""Association for Computational Linguistics"",
doi = ""10.18653/v1/P17-1017"",
pages = ""179--188"",
url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):