q_re_cc

  • Mô tả :

Một bộ dữ liệu chứa 14 nghìn cuộc hội thoại với 81 nghìn cặp câu hỏi-câu trả lời. QReCC được xây dựng dựa trên các câu hỏi từ TREC CAsT, QuAC và Google Natural Questions.

Tách ra ví dụ
'test' 16,451
'train' 63,501
  • Cấu trúc tính năng :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'answer_url': Text(shape=(), dtype=string),
    'context': Sequence(Text(shape=(), dtype=string)),
    'conversation_id': Scalar(shape=(), dtype=int32),
    'question': Text(shape=(), dtype=string),
    'question_rewrite': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'turn_id': Scalar(shape=(), dtype=int32),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
câu trả lời Chữ chuỗi
answer_url Chữ chuỗi
bối cảnh Trình tự (Văn bản) (Không có,) chuỗi
cuộc hội thoại_id Vô hướng int32 Id của cuộc hội thoại.
câu hỏi Chữ chuỗi
question_rewrite Chữ chuỗi
nguồn Chữ chuỗi Nguồn ban đầu của dữ liệu -- QuAC, CAsT hoặc Natural Questions
turn_id Vô hướng int32 Id của lượt hội thoại, trong một cuộc hội thoại.
  • trích dẫn :
@article{qrecc,
  title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year={2021}
}