एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

सामान्य ज्ञान

  • विवरण:

TriviaqQA एक रीडिंग कॉम्प्रिहेंशन डेटासेट है जिसमें 650K से अधिक प्रश्न-उत्तर-साक्ष्य ट्रिपल हैं। TriviaqQA में सामान्य ज्ञान के प्रति उत्साही द्वारा लिखित 95K प्रश्न-उत्तर जोड़े शामिल हैं और स्वतंत्र रूप से एकत्रित साक्ष्य दस्तावेज, औसतन छह प्रति प्रश्न, जो प्रश्नों का उत्तर देने के लिए उच्च गुणवत्ता वाले दूरस्थ पर्यवेक्षण प्रदान करते हैं।

विभाजित करना उदाहरण
'test' १०,८३२
'train' ८७,६२२
'validation' ११,३१३
  • विशेषताएं:
FeaturesDict({
    'answer': FeaturesDict({
        'aliases': Sequence(Text(shape=(), dtype=tf.string)),
        'matched_wiki_entity_name': Text(shape=(), dtype=tf.string),
        'normalized_aliases': Sequence(Text(shape=(), dtype=tf.string)),
        'normalized_matched_wiki_entity_name': Text(shape=(), dtype=tf.string),
        'normalized_value': Text(shape=(), dtype=tf.string),
        'type': Text(shape=(), dtype=tf.string),
        'value': Text(shape=(), dtype=tf.string),
    }),
    'entity_pages': Sequence({
        'doc_source': Text(shape=(), dtype=tf.string),
        'filename': Text(shape=(), dtype=tf.string),
        'title': Text(shape=(), dtype=tf.string),
        'wiki_context': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'question_id': Text(shape=(), dtype=tf.string),
    'question_source': Text(shape=(), dtype=tf.string),
    'search_results': Sequence({
        'description': Text(shape=(), dtype=tf.string),
        'filename': Text(shape=(), dtype=tf.string),
        'rank': tf.int32,
        'search_context': Text(shape=(), dtype=tf.string),
        'title': Text(shape=(), dtype=tf.string),
        'url': Text(shape=(), dtype=tf.string),
    }),
})
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): None

  • चित्रा ( tfds.show_examples ): समर्थित नहीं।

  • प्रशस्ति पत्र:

@article{2017arXivtriviaqa,
       author = { {Joshi}, Mandar and {Choi}, Eunsol and {Weld},
                 Daniel and {Zettlemoyer}, Luke},
        title = "{triviaqa: A Large Scale Distantly Supervised Challenge Dataset for Reading Comprehension}",
      journal = {arXiv e-prints},
         year = 2017,
          eid = {arXiv:1705.03551},
        pages = {arXiv:1705.03551},
archivePrefix = {arXiv},
       eprint = {1705.03551},
}

trivia_qa/rc (डिफ़ॉल्ट कॉन्फ़िग)

  • कॉन्फ़िग विवरण: प्रश्नोत्तर जोड़े जहां किसी दिए गए प्रश्न के लिए सभी दस्तावेजों जवाब स्ट्रिंग (रों) होते हैं। विकिपीडिया और खोज परिणामों से संदर्भ शामिल है।

  • उदाहरण ( tfds.as_dataframe ):

trivia_qa/rc.nocontext

  • कॉन्फ़िग विवरण: प्रश्नोत्तर जोड़े जहां किसी दिए गए प्रश्न के लिए सभी दस्तावेजों जवाब स्ट्रिंग (रों) होते हैं।

  • उदाहरण ( tfds.as_dataframe ):

सामान्य ज्ञान_क्यूए/अनफ़िल्टर्ड

  • कॉन्फ़िग विवरण: खुले डोमेन क्यूए जहां नहीं दिए गए प्रश्न के लिए सभी दस्तावेजों जवाब स्ट्रिंग (यों) में के लिए 110k प्रश्नोत्तर जोड़े। यह अनफ़िल्टर्ड डेटासेट को IR-शैली QA के लिए अधिक उपयुक्त बनाता है। विकिपीडिया और खोज परिणामों से संदर्भ शामिल है।

  • उदाहरण ( tfds.as_dataframe ):

trivia_qa/unfiltered.nocontext

  • कॉन्फ़िग विवरण: खुले डोमेन क्यूए जहां नहीं दिए गए प्रश्न के लिए सभी दस्तावेजों जवाब स्ट्रिंग (यों) में के लिए 110k प्रश्नोत्तर जोड़े। यह अनफ़िल्टर्ड डेटासेट को IR-शैली QA के लिए अधिक उपयुक्त बनाता है।

  • उदाहरण ( tfds.as_dataframe ):