q_re_cc

  • توضیحات :

مجموعه داده ای حاوی 14 هزار مکالمه با 81 هزار جفت پرسش و پاسخ. QReCC بر اساس سوالات TREC CAsT، QuAC و Google Natural Questions ساخته شده است.

شکاف مثال ها
'test' 16,451
'train' 63,501
  • ساختار ویژگی :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'answer_url': Text(shape=(), dtype=string),
    'context': Sequence(Text(shape=(), dtype=string)),
    'conversation_id': Scalar(shape=(), dtype=int32),
    'question': Text(shape=(), dtype=string),
    'question_rewrite': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'turn_id': Scalar(shape=(), dtype=int32),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
پاسخ متن رشته
answer_url متن رشته
متن نوشته دنباله (متن) (هیچ یک،) رشته
گفتگو_id اسکالر int32 شناسه مکالمه
سوال متن رشته
سوال_بازنویسی متن رشته
منبع متن رشته منبع اصلی داده ها - QuAC، CAsT یا Natural Questions
turn_id اسکالر int32 شناسه مکالمه در یک مکالمه تبدیل می شود.
  • نقل قول :
@article{qrecc,
  title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year={2021}
}