09:00 पीएसटी पर एमएल संगोष्ठी इस मंगलवार, 19 अक्टूबर में पहले महिलाओं में ट्यून रजिस्टर अब

xquad

  • विवरण:

XQuAD (क्रॉस-लिंगुअल क्वेश्चन आंसरिंग डेटासेट) क्रॉस-लिंगुअल क्वेश्चन आंसरिंग परफॉर्मेंस के मूल्यांकन के लिए एक बेंचमार्क डेटासेट है। डेटासेट में SQuAD v1.1 (राजपुरकर एट अल।, 2016) के विकास सेट से 240 पैराग्राफ और 1190 प्रश्न-उत्तर जोड़े का एक सबसेट होता है, जिसमें उनके पेशेवर अनुवाद दस भाषाओं में होते हैं: स्पेनिश, जर्मन, ग्रीक, रूसी, तुर्की , अरबी, वियतनामी, थाई, चीनी और हिंदी। नतीजतन, डेटासेट पूरी तरह से 11 भाषाओं में समानांतर है। डिफ़ॉल्ट शून्य शॉट की स्थापना में XQuAD चलाने के लिए, टीम v1.1 प्रशिक्षण और मान्यता डेटा यहाँ का उपयोग करें: https://www.tensorflow.org/datasets/catalog/squad

हम XTREME (हू एट अल।, 2020) से प्रत्येक गैर-अंग्रेज़ी भाषा के लिए "अनुवाद-ट्रेन", "अनुवाद-देव", और "अनुवाद-परीक्षण" विभाजन भी शामिल करते हैं। इनका उपयोग XQuAD को "ट्रांसलेट-ट्रेन" या "ट्रांसलेट-टेस्ट" सेटिंग्स में चलाने के लिए किया जा सकता है।

  • होमपेज: https://github.com/deepmind/xquad

  • स्रोत कोड: tfds.question_answering.Xquad

  • संस्करण:

    • 3.0.0 (डिफ़ॉल्ट): जहां जवाब फैला संदर्भ सफेद-अंतरिक्ष हटाने की वजह से गलत संरेखित कर रहे हैं उदाहरण के एक संख्या के साथ सुधार मुद्दा। यह परिवर्तन लगभग 14% परीक्षण उदाहरणों को प्रभावित करता है।
  • विशेषताएं:

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
  • पर्यवेक्षित कुंजियों (देखें as_supervised डॉक ): None

  • चित्रा ( tfds.show_examples ): समर्थित नहीं।

  • प्रशस्ति पत्र:

@article{Artetxe:etal:2019,
      author    = {Mikel Artetxe and Sebastian Ruder and Dani Yogatama},
      title     = {On the cross-lingual transferability of monolingual representations},
      journal   = {CoRR},
      volume    = {abs/1910.11856},
      year      = {2019},
      archivePrefix = {arXiv},
      eprint    = {1910.11856}
}

xquad/ar (डिफ़ॉल्ट कॉन्फ़िग)

  • कॉन्फ़िग विवरण: XQuAD 'ar' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ (हू एट अल, 2020।)।

  • डाउनलोड का आकार: 420.97 MiB

  • डेटासेट का आकार: 134.83 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' १०,५४१
'translate-test' 1,151
'translate-train' ८६,७८७

xquad/de

  • कॉन्फ़िग विवरण: (। हू एट अल, 2020) XQuAD 'डी' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ।

  • डाउनलोड का आकार: 127.04 MiB

  • डेटासेट का आकार: 98.80 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' १०,३७१
'translate-test' 1,168
'translate-train' 82,603

xquad/el

  • कॉन्फ़िग विवरण: XQuAD 'एल' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ (हू एट अल, 2020।)।

  • डाउनलोड का आकार: 499.40 MiB

  • डेटासेट का आकार: 157.90 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ (परीक्षण, का अनुवाद-देव, का अनुवाद-परीक्षण), केवल जब shuffle_files=False (अनुवाद कर ट्रेन)

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' १०,१००
'translate-test' 1,182
'translate-train' 79,946

xquad/es

  • कॉन्फ़िग विवरण: XQuAD 'तों' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ (हू एट अल, 2020।)।

  • डाउनलोड का आकार: 138.41 MiB

  • डेटासेट का आकार: 104.96 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' १०,५६६
'translate-test' 1,188
'translate-train' 87,488

xquad/हाय

  • कॉन्फ़िग विवरण: XQuAD 'हाय' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ (हू एट अल, 2020।)।

  • डाउनलोड का आकार: 472.23 MiB

  • डेटासेट का आकार: 207.85 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ (परीक्षण, का अनुवाद-देव, का अनुवाद-परीक्षण), केवल जब shuffle_files=False (अनुवाद कर ट्रेन)

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' १०,५३६
'translate-test' 1,184
'translate-train' 85,804

xquad/ru

  • कॉन्फ़िग विवरण: XQuAD 'आरयू' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ (हू एट अल, 2020।)।

  • डाउनलोड का आकार: 513.80 MiB

  • डेटासेट का आकार: 159.38 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ (परीक्षण, का अनुवाद-देव, का अनुवाद-परीक्षण), केवल जब shuffle_files=False (अनुवाद कर ट्रेन)

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' १०,४६९
'translate-test' 1,190
'translate-train' ८४,८६९

xquad/th

  • कॉन्फ़िग विवरण: XQuAD 'वें' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ (हू एट अल, 2020।)।

  • डाउनलोड का आकार: 461.54 MiB

  • डेटासेट का आकार: 199.57 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ (परीक्षण, का अनुवाद-देव, का अनुवाद-परीक्षण), केवल जब shuffle_files=False (अनुवाद कर ट्रेन)

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' १०,५१६
'translate-test' 1,157
'translate-train' 85,846

xquad/tr

  • कॉन्फ़िग विवरण: XQuAD 'tr' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ (हू एट अल, 2020।)।

  • डाउनलोड का आकार: 151.08 MiB

  • डेटासेट का आकार: 97.56 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' १०,५३५
'translate-test' 1,112
'translate-train' ८६,५११

xquad/vi

  • कॉन्फ़िग विवरण: (। हू एट अल, 2020) XQuAD 'vi' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ।

  • डाउनलोड का आकार: 218.09 MiB

  • डेटासेट का आकार: 120.03 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' १०,५५५
'translate-test' 1,178
'translate-train' ८७,१८७

xquad/zh

  • कॉन्फ़िग विवरण: XQuAD 'zh' परीक्षण विभाजन, चरम से मशीन द्वारा अनुवाद का अनुवाद ट्रेन / अनुवाद-देव / अनुवाद परीक्षण विभाजन के साथ (हू एट अल, 2020।)।

  • डाउनलोड का आकार: 174.57 MiB

  • डेटासेट का आकार: 80.79 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190
'translate-dev' 10,475
'translate-test' 1,186
'translate-train' 85,700

xquad/en

  • कॉन्फ़िग विवरण: XQuAD 'एन' परीक्षण विभाजित।

  • डाउनलोड का आकार: 595.10 KiB

  • डेटासेट का आकार: 1.19 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'test' 1,190