- Описание :
BoolQ — это набор данных для ответов на вопросы «да/нет», содержащий 15942 примера. Эти вопросы возникают естественным образом, они генерируются в непринужденной и непринужденной обстановке.
Каждый пример представляет собой триплет (вопрос, отрывок, ответ) с заголовком страницы в качестве необязательного дополнительного контекста. Настройка классификации текстовых пар аналогична существующим задачам вывода на естественном языке.
Домашняя страница : https://github.com/google-research-datasets/boolean-questions
Исходный код :
tfds.text.bool_q.BoolQ
Версии :
-
1.0.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
8.36 MiB
Размер набора данных :
8.51 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 9427 |
'validation' | 3270 |
- Особенности :
FeaturesDict({
'answer': tf.bool,
'passage': Text(shape=(), dtype=tf.string),
'question': Text(shape=(), dtype=tf.string),
'title': Text(shape=(), dtype=tf.string),
})
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}