q_re_cc

  • Açıklama :

81K soru-cevap çifti ile 14K konuşma içeren bir veri seti. QReCC, TREC CAsT, QuAC ve Google Natural Questions'tan alınan sorular üzerine kurulmuştur.

Bölmek örnekler
'test' 16.451
'train' 63.501
  • Özellik yapısı :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'answer_url': Text(shape=(), dtype=string),
    'context': Sequence(Text(shape=(), dtype=string)),
    'conversation_id': Scalar(shape=(), dtype=int32),
    'question': Text(shape=(), dtype=string),
    'question_rewrite': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'turn_id': Scalar(shape=(), dtype=int32),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
Cevap Metin sicim
cevap_url'si Metin sicim
bağlam Sıra(Metin) (Hiçbiri,) sicim
konuşma_kimliği skaler int32 Görüşmenin kimliği.
soru Metin sicim
soru_yeniden yaz Metin sicim
kaynak Metin sicim Verilerin orijinal kaynağı -- QuAC, CAsT veya Natural Questions
turn_id skaler int32 Konuşmanın kimliği, bir konuşma içinde değişir.
  • Alıntı :
@article{qrecc,
  title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year={2021}
}