q_re_cc

  • Описание :

Набор данных, содержащий 14 тысяч разговоров с 81 тысячей пар вопросов и ответов. QReCC построен на вопросах из TREC CAsT, QuAC и Google Natural Questions.

  • Домашняя страница : https://github.com/apple/ml-qrecc

  • Исходный код : tfds.text.qrecc.QReCC

  • Версии :

    • 1.0.0 (по умолчанию): Первоначальный выпуск.
  • Размер загрузки : 7.60 MiB

  • Размер набора данных : 69.29 MiB .

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 16 451
'train' 63 501
  • Структура функции :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'answer_url': Text(shape=(), dtype=string),
    'context': Sequence(Text(shape=(), dtype=string)),
    'conversation_id': Scalar(shape=(), dtype=int32),
    'question': Text(shape=(), dtype=string),
    'question_rewrite': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'turn_id': Scalar(shape=(), dtype=int32),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
отвечать Текст нить
answer_url Текст нить
контекст Последовательность (текст) (Никто,) нить
ид_беседы Скаляр int32 Идентификатор беседы.
вопрос Текст нить
вопрос_переписать Текст нить
источник Текст нить Первоисточник данных — либо QuAC, CAsT, либо Natural Questions.
поворот_идентификатор Скаляр int32 Идентификатор хода беседы в беседе.
  • Цитата :
@article{qrecc,
  title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year={2021}
}