q_re_cc

विवरण :

एक डेटासेट जिसमें 81K प्रश्न-उत्तर जोड़े के साथ 14K वार्तालाप हैं। QReCC TREC CAsT, QuAC और Google प्राकृतिक प्रश्नों के प्रश्नों पर बनाया गया है।

मुखपृष्ठ : https://github.com/apple/ml-qrecc
स्रोत कोड : tfds.text.qrecc.QReCC
संस्करण :
- 1.0.0 (डिफ़ॉल्ट): प्रारंभिक रिलीज़।
डाउनलोड आकार : 7.60 MiB
डेटासेट का आकार : 69.29 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :

विभाजित करना	उदाहरण
`'test'`	16,451
`'train'`	63,501

फ़ीचर संरचना :

FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'answer_url': Text(shape=(), dtype=string),
    'context': Sequence(Text(shape=(), dtype=string)),
    'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
    'question': Text(shape=(), dtype=string),
    'question_rewrite': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	आकार	डीप्रकार	विवरण
	फीचर्सडिक्ट
उत्तर	मूलपाठ		डोरी
उत्तर_यूआरएल	मूलपाठ		डोरी
प्रसंग	अनुक्रम(पाठ)	(कोई नहीं,)	डोरी
बातचीत_आईडी	अदिश		int32	बातचीत की आईडी.
सवाल	मूलपाठ		डोरी
प्रश्न_पुनर्लिखित	मूलपाठ		डोरी
स्रोत	मूलपाठ		डोरी	डेटा का मूल स्रोत - या तो क्वैक, सीएएसटी या प्राकृतिक प्रश्न
टर्न_आईडी	अदिश		int32	बातचीत की आईडी, बातचीत के भीतर बदल जाती है।

पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):

उद्धरण :

@article{qrecc,
  title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year={2021}
}

q_re_cc संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

q_re_cc