q_re_cc

  • Descrizione :

Un set di dati contenente 14.000 conversazioni con 81.000 coppie domanda-risposta. QReCC si basa su domande di TREC CAsT, QuAC e Google Natural Questions.

Diviso Esempi
'test' 16.451
'train' 63.501
  • Struttura delle caratteristiche :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'answer_url': Text(shape=(), dtype=string),
    'context': Sequence(Text(shape=(), dtype=string)),
    'conversation_id': Scalar(shape=(), dtype=int32),
    'question': Text(shape=(), dtype=string),
    'question_rewrite': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'turn_id': Scalar(shape=(), dtype=int32),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
Rispondere Testo corda
risposta_url Testo corda
contesto Sequenza(Testo) (Nessuno,) corda
id_conversazione Scalare int32 L'id della conversazione.
domanda Testo corda
question_rewrite Testo corda
fonte Testo corda La fonte originale dei dati: QuAC, CAsT o Natural Questions
turn_id Scalare int32 L'id della conversazione gira, all'interno di una conversazione.
  • Citazione :
@article{qrecc,
  title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year={2021}
}