- توضیحات :
این مجموعه داده شامل 6،642 جفت سوال / پاسخ است. فرض می شود که س questionsالات توسط Freebase ، یک نمودار بزرگ دانش ، پاسخگو باشند. سوالات بیشتر حول یک موجود واحد منفرد است. این س areالات محبوب ترین س onالات در وب (حداقل در سال 2013) است.
صفحه اصلی : https://worksheets.codalab.org/worksheets/0xba659fe363cb46e7a505c5b6a774dc8a
کد منبع :
tfds.question_answering.WebQuestions
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
1.21 MiB
اندازه مجموعه داده :
983.88 KiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 2032 |
'train' | 3،778 |
- ویژگی ها :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=tf.string)),
'question': Text(shape=(), dtype=tf.string),
'url': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
نقل قول :
@inproceedings{berant-etal-2013-semantic,
title = "Semantic Parsing on {F}reebase from Question-Answer Pairs",
author = "Berant, Jonathan and
Chou, Andrew and
Frostig, Roy and
Liang, Percy",
booktitle = "Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing",
month = oct,
year = "2013",
address = "Seattle, Washington, USA",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/D13-1160",
pages = "1533--1544",
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):