Tayfa

  • Açıklama:

Stanford Soru Yanıtlama Veri Kümesi (SQuAD), kitle çalışanları tarafından bir dizi Wikipedia makalesinde sorulan sorulardan oluşan ve her sorunun cevabının ilgili okuma pasajından veya sorudan bir metin parçası veya aralık olduğu bir okuduğunu anlama veri kümesidir. cevapsız olabilir.

@article{2016arXiv160605250R,
       author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
                 Konstantin and {Liang}, Percy},
        title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
      journal = {arXiv e-prints},
         year = 2016,
          eid = {arXiv:1606.05250},
        pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
       eprint = {1606.05250},
}

kadro/v1.1 (varsayılan yapılandırma)

  • Yapılandırma tanımı: Squad sürüm 1.1.0

  • İndirme boyutu: 33.51 MiB

  • Veri kümesi boyutu: 94.06 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Evet

  • Splits:

Bölmek Örnekler
'train' 87.599
'validation' 10.570
  • Özellikler:
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

kadro/v2.0

  • Yapılandırma tanımı: Squad sürüm 2.0.0

  • İndirme boyutu: 44.34 MiB

  • Veri kümesi boyutu: 148.54 MiB

  • Otomatik önbelleğe ( dokümantasyon ): Evet (doğrulama), Sadece zaman shuffle_files=False (tren)

  • Splits:

Bölmek Örnekler
'train' 130.319
'validation' 11.873
  • Özellikler:
FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'is_impossible': tf.bool,
    'plausible_answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})