एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

पैरा_क्रॉल

  • विवरण:

आधिकारिक यूरोपीय भाषाओं के लिए वेब-स्केल समानांतर कॉर्पोरा।

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट bg करने के लिए।

  • डाउनलोड का आकार: 98.94 MiB

  • डेटासेट का आकार: 362.46 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 1,039,885
  • विशेषताएं:
Translation({
    'bg': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

पैरा_क्रॉल/एनसीएस

  • कॉन्फ़िग विवरण: सीएस अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 187.31 MiB

  • डेटासेट का आकार: 666.34 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' २,९८१,९४९
  • विशेषताएं:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/enda

  • कॉन्फ़िग विवरण: दा को अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 174.34 MiB

  • डेटासेट का आकार: 619.77 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' २,४१४,८९५
  • विशेषताएं:
Translation({
    'da': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/ende

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट डी करने के लिए।

  • डाउनलोड का आकार: 1.22 GiB

  • डेटासेट का आकार: 4.04 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 16,264,448
  • विशेषताएं:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

पैरा_क्रॉल/एनेल

  • कॉन्फ़िग विवरण: एल अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 184.59 MiB

  • डेटासेट का आकार: 698.75 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 1,985,233
  • विशेषताएं:
Translation({
    'el': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/enes

  • कॉन्फ़िग विवरण: es करने के लिए अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 1.82 GiB

  • डेटासेट का आकार: 6.23 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' २१,९८७,२६७
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'es': Text(shape=(), dtype=tf.string),
})

पैरा_क्रॉल/एनेट

  • कॉन्फ़िग विवरण: एट के लिए अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 66.91 MiB

  • डेटासेट का आकार: 209.16 MiB

  • ऑटो-कैश ( प्रलेखन ): केवल जब shuffle_files=False (ट्रेन)

  • विभाजन:

विभाजित करना उदाहरण
'train' ८५३,४२२
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'et': Text(shape=(), dtype=tf.string),
})

para_crawl/enfi

  • कॉन्फ़िग विवरण: इंटरनेट के लिए अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 151.83 MiB

  • डेटासेट का आकार: 543.85 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 2,156,069
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

para_crawl/enfr

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट fr करने के लिए।

  • डाउनलोड का आकार: 2.63 GiB

  • डेटासेट का आकार: 9.04 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 31,374,161
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fr': Text(shape=(), dtype=tf.string),
})

para_crawl/enga

  • कॉन्फ़िग विवरण: ga अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 28.03 MiB

  • डेटासेट का आकार: 107.09 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'train' 357,399
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ga': Text(shape=(), dtype=tf.string),
})

para_crawl/enhr

  • कॉन्फ़िग विवरण: घंटा अंग्रेज़ी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 80.97 MiB

  • डेटासेट का आकार: 256.37 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 1,002,053
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hr': Text(shape=(), dtype=tf.string),
})

para_crawl/enhu

  • कॉन्फ़िग विवरण: hu अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 114.24 MiB

  • डेटासेट का आकार: 421.40 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 1,901,342
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hu': Text(shape=(), dtype=tf.string),
})

para_crawl/enit

  • कॉन्फ़िग विवरण: यह करने के लिए अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 1017.30 MiB

  • डेटासेट का आकार: 3.36 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 12,162,239
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'it': Text(shape=(), dtype=tf.string),
})

para_crawl/enlt

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट लेफ्टिनेंट करने के लिए।

  • डाउनलोड का आकार: 63.28 MiB

  • डेटासेट का आकार: 204.70 MiB

  • ऑटो-कैश ( प्रलेखन ): केवल जब shuffle_files=False (ट्रेन)

  • विभाजन:

विभाजित करना उदाहरण
'train' ८४४,६४३
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lt': Text(shape=(), dtype=tf.string),
})

para_crawl/enlv

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट एल.वी.।

  • डाउनलोड का आकार: 45.17 MiB

  • डेटासेट का आकार: 147.09 MiB

  • ऑटो-कैश ( प्रलेखन ): केवल जब shuffle_files=False (ट्रेन)

  • विभाजन:

विभाजित करना उदाहरण
'train' ५५३,०६०
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lv': Text(shape=(), dtype=tf.string),
})

para_crawl/enmt

  • कॉन्फ़िग विवरण: मीट्रिक टन करने के लिए अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 18.15 MiB

  • डेटासेट का आकार: 54.36 MiB

  • ऑटो-कैश ( प्रलेखन ): हाँ

  • विभाजन:

विभाजित करना उदाहरण
'train' 195,502
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'mt': Text(shape=(), dtype=tf.string),
})

para_crawl/ennl

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट NL करने के लिए।

  • डाउनलोड का आकार: 400.63 MiB

  • डेटासेट का आकार: 1.40 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 5,659,268
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'nl': Text(shape=(), dtype=tf.string),
})

para_crawl/enpl

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट pl करने के लिए।

  • डाउनलोड का आकार: 257.90 MiB

  • डेटासेट का आकार: 885.63 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 3,503,276
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pl': Text(shape=(), dtype=tf.string),
})

para_crawl/enpt

  • कॉन्फ़िग विवरण: pt अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 608.62 MiB

  • डेटासेट का आकार: 2.05 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 8,141,940
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

para_crawl/enro

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट भूमिका करने के लिए।

  • डाउनलोड का आकार: 153.24 MiB

  • डेटासेट का आकार: 534.34 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 1,952,043
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ro': Text(shape=(), dtype=tf.string),
})

para_crawl/ensk

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट एसके करने के लिए।

  • डाउनलोड का आकार: 96.61 MiB

  • डेटासेट का आकार: 352.91 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 1,591,831
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sk': Text(shape=(), dtype=tf.string),
})

para_crawl/ensl

  • कॉन्फ़िग विवरण: sl अंग्रेजी से अनुवाद डाटासेट।

  • डाउनलोड का आकार: 62.02 MiB

  • डेटासेट का आकार: 187.66 MiB

  • ऑटो-कैश ( प्रलेखन ): केवल जब shuffle_files=False (ट्रेन)

  • विभाजन:

विभाजित करना उदाहरण
'train' 660,161
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sl': Text(shape=(), dtype=tf.string),
})

para_crawl/ensv

  • कॉन्फ़िग विवरण: अंग्रेजी से अनुवाद डाटासेट एसवी करने के लिए।

  • डाउनलोड का आकार: 262.76 MiB

  • डेटासेट का आकार: 905.72 MiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'train' 3,476,729
  • विशेषताएं:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sv': Text(shape=(), dtype=tf.string),
})