- توضیحات :
داده ها شامل مجموعه های 1 تا 7 سه گانه شکل موضوع-محمول-شی object استخراج شده از (DBpedia) [ https://wiki.dbpedia.org/ ] و متن زبان طبیعی است که کلامی بودن این سه گانه است. داده های آزمون شامل 15 حوزه مختلف است که فقط 10 مورد در داده های آموزش وجود دارد. مجموعه داده از قالب جدول استاندارد شده پیروی می کند.
صفحه اصلی : https://webnlg-challenge.loria.fr/challenge_2017/
کد منبع :
tfds.structured.web_nlg.WebNlg
نسخه ها :
-
0.1.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
19.76 MiB
اندازه مجموعه داده :
13.78 MiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'test_all' | 4،928 |
'test_unseen' | 2،433 |
'train' | 18،102 |
'validation' | 2،268 |
- ویژگی ها :
FeaturesDict({
'input_text': FeaturesDict({
'context': tf.string,
'table': Sequence({
'column_header': tf.string,
'content': tf.string,
'row_number': tf.int16,
}),
}),
'target_text': tf.string,
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('input_text', 'target_text')
نقل قول :
@inproceedings{gardent2017creating,
title = ""Creating Training Corpora for {NLG} Micro-Planners"",
author = ""Gardent, Claire and
Shimorina, Anastasia and
Narayan, Shashi and
Perez-Beltrachini, Laura"",
booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
month = jul,
year = ""2017"",
address = ""Vancouver, Canada"",
publisher = ""Association for Computational Linguistics"",
doi = ""10.18653/v1/P17-1017"",
pages = ""179--188"",
url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):