एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

रेस

  • विवरण:

रेस एक बड़े पैमाने पर पढ़ने की समझ वाला डेटासेट है जिसमें 28,000 से अधिक पैसेज और लगभग 100,000 प्रश्न हैं। डेटासेट चीन में अंग्रेजी परीक्षाओं से एकत्र किया जाता है, जो मिडिल स्कूल और हाई स्कूल के छात्रों के लिए डिज़ाइन किए गए हैं। डेटासेट को मशीन की समझ के लिए प्रशिक्षण और परीक्षण सेट के रूप में परोसा जा सकता है।

  • कॉन्फ़िग विवरण: रेस डेटासेट के लिए बिल्डर config।

  • होमपेज: https://www.cs.cmu.edu/~glai1/data/race/

  • स्रोत कोड: tfds.text.race.Race

  • संस्करण:

    • 1.0.0 : प्रारंभिक रिलीज़।
    • 2.0.0 (डिफ़ॉल्ट): उदाहरण आईडी जोड़ें।
  • डाउनलोड का आकार: 24.26 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विशेषताएं:

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): None

  • चित्रा ( tfds.show_examples ): समर्थित नहीं।

  • प्रशस्ति पत्र:

@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

दौड़/उच्च (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • डेटासेट का आकार: 52.39 MiB

  • विभाजन:

विभाजित करना उदाहरण
'dev' 1,021
'test' 1,045
'train' 18,728

दौड़ / मध्य

  • डेटासेट का आकार: 12.51 MiB

  • विभाजन:

विभाजित करना उदाहरण
'dev' 368
'test' 362
'train' 6,409