- Описание:
MC-TACO - это набор данных из 13 тысяч пар вопросов и ответов, требующих временного здравого смысла. Набор данных содержит пять временных свойств:
- продолжительность (сколько времени длится мероприятие)
- временное упорядочение (типичный порядок событий)
- типичное время (когда происходит событие)
- частота (как часто происходит событие)
- стационарность (сохраняется ли состояние очень долго или бесконечно)
Мы надеемся, что этот набор данных может способствовать дальнейшему исследованию именно этого класса проблем рассуждения.
Домашняя страница: https://github.com/CogComp/MCTACO
Исходный код:
tfds.question_answering.Mctaco
Версии:
-
1.0.0
( по умолчанию): Нет Замечания к выпуску.
-
Скачать Размер:
2.27 MiB
Dataset Размер:
3.18 MiB
Авто-кэшируются ( документация ): Да
расколы:
Расколоть | Примеры |
---|---|
'test' | 9 442 |
'validation' | 3783 |
- Особенности:
FeaturesDict({
'answer': Text(shape=(), dtype=tf.string),
'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'question': Text(shape=(), dtype=tf.string),
'sentence': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):None
Рис ( tfds.show_examples ): Не поддерживается.
Примеры ( tfds.as_dataframe ):
- Образец цитирования:
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}