q_re_cc

  • Descrição :

Um conjunto de dados contendo 14 mil conversas com 81 mil pares de perguntas e respostas. O QReCC é construído com base em perguntas do TREC CAsT, QuAC e Google Natural Questions.

Dividir Exemplos
'test' 16.451
'train' 63.501
  • Estrutura de recursos :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'answer_url': Text(shape=(), dtype=string),
    'context': Sequence(Text(shape=(), dtype=string)),
    'conversation_id': Scalar(shape=(), dtype=int32),
    'question': Text(shape=(), dtype=string),
    'question_rewrite': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'turn_id': Scalar(shape=(), dtype=int32),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
responder Texto fragmento
answer_url Texto fragmento
contexto Sequência (Texto) (Nenhum,) fragmento
id da conversação Escalar int32 O id da conversa.
pergunta Texto fragmento
question_rewrite Texto fragmento
fonte Texto fragmento A fonte original dos dados -- QuAC, CAsT ou Natural Questions
turn_id Escalar int32 O id do turno da conversa, dentro de uma conversa.
  • Citação :
@article{qrecc,
  title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year={2021}
}