एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

दस्ता

  • विवरण:

स्टैनफोर्ड क्वेश्चन आंसरिंग डेटासेट (SQuAD) एक रीडिंग कॉम्प्रिहेंशन डेटासेट है, जिसमें विकिपीडिया लेखों के एक सेट पर क्राउडवर्कर्स द्वारा पूछे गए प्रश्न शामिल हैं, जहाँ हर प्रश्न का उत्तर संबंधित रीडिंग पैसेज, या प्रश्न से टेक्स्ट, या स्पैन का एक सेगमेंट है। अनुत्तरदायी हो सकता है।

  • होमपेज: https://rajpurkar.github.io/SQuAD-explorer/

  • स्रोत कोड: tfds.question_answering.squad.Squad

  • संस्करण:

    • 3.0.0 (डिफ़ॉल्ट): उदाहरण के छोटी संख्या (19) जहां जवाब फैला संदर्भ सफेद-अंतरिक्ष हटाने की वजह से गलत संरेखित कर रहे हैं के साथ सुधार मुद्दा।
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): None

  • चित्रा ( tfds.show_examples ): समर्थित नहीं।

  • प्रशस्ति पत्र:

@article{2016arXiv160605250R,
       author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
                 Konstantin and {Liang}, Percy},
        title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
      journal = {arXiv e-prints},
         year = 2016,
          eid = {arXiv:1606.05250},
        pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
       eprint = {1606.05250},
}

दस्ते/v1.1 (डिफ़ॉल्ट विन्यास)

  • कॉन्फ़िग विवरण: दस्ते के संस्करण 1.1.0

  • डाउनलोड का आकार: 33.51 MiB

  • डेटासेट का आकार: 94.06 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'train' ८७,५९९
'validation' १०,५७०
  • विशेषताएं:
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

दस्ते/v2.0

  • कॉन्फ़िग विवरण: दस्ते के संस्करण 2.0.0

  • डाउनलोड का आकार: 44.34 MiB

  • डेटासेट का आकार: 148.54 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ (सत्यापन), केवल जब shuffle_files=False (ट्रेन)

  • विभाजन:

विभाजित करना उदाहरण
'train' १३०,३१९
'validation' ११,८७३
  • विशेषताएं:
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'is_impossible': tf.bool,
    'plausible_answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})