- توضیحات :
MC-TACO مجموعه ای متشکل از 13k جفت سوال-پاسخ است که به درک متغیر زمانی نیاز دارند. مجموعه داده شامل پنج ویژگی زمانی است:
- مدت زمان (مدت زمانی که یک رویداد طول می کشد)
- ترتیب زمانی (ترتیب معمول رویدادها)
- زمان معمول (زمانی که یک واقعه رخ می دهد)
- فرکانس (هر چند وقت یک بار اتفاق می افتد)
- ایستایی (چه یک کشور برای مدت زمان طولانی حفظ می شود یا به طور نامحدود)
ما امیدواریم که این مجموعه داده بتواند باعث کاوش در آینده در این کلاس خاص از مشکلات استدلال شود.
صفحه اصلی : https://github.com/CogComp/MCTACO
کد منبع :
tfds.question_answering.Mctaco
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
2.27 MiB
اندازه مجموعه داده :
3.18 MiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 9،442 |
'validation' | 3،783 |
- ویژگی ها :
FeaturesDict({
'answer': Text(shape=(), dtype=tf.string),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'question': Text(shape=(), dtype=tf.string),
'sentence': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
نقل قول :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):