Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

para_pełzanie

  • opis:

Korporacja równoległa w skali internetowej dla oficjalnych języków europejskich.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (konfiguracja domyślna)

  • Opis config: zbiór danych Tłumaczenie z angielskiego na bg.

  • Wielkość pliku: 98.94 MiB

  • Zbiór danych rozmiar: 362.46 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 1 039 885
  • Cechy:
Translation({
    'bg': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/encs

  • Opis config: zbiór danych Tłumaczenie z angielskiego na cs.

  • Wielkość pliku: 187.31 MiB

  • Zbiór danych rozmiar: 666.34 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 2 981 949
  • Cechy:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/end

  • Opis config: zbiór danych Tłumaczenie z angielskiego na da.

  • Wielkość pliku: 174.34 MiB

  • Zbiór danych rozmiar: 619.77 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 2 414 895
  • Cechy:
Translation({
    'da': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/ende

  • Opis config: zbiór danych Tłumaczenie z języka angielskiego na DE.

  • Wielkość pliku: 1.22 GiB

  • Zestaw danych rozmiar: 4.04 GiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 16 264 448
  • Cechy:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/enel

  • Opis config: zbiór danych Tłumaczenie z angielskiego na el.

  • Wielkość pliku: 184.59 MiB

  • Zbiór danych rozmiar: 698.75 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 1 985 233
  • Cechy:
Translation({
    'el': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

para_crawl/enes

  • Opis config: zbiór danych Tłumaczenie z angielskiego na es.

  • Wielkość pliku: 1.82 GiB

  • Zbiór danych rozmiar: 6.23 GiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 21 987 267
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'es': Text(shape=(), dtype=tf.string),
})

para_crawl/enet

  • Opis config: zbiór danych Tłumaczenie z angielskiego na ET.

  • Wielkość pliku: 66.91 MiB

  • Zbiór danych rozmiar: 209.16 MiB

  • Auto-buforowane ( dokumentacja ): Tylko kiedy shuffle_files=False (pociąg)

  • dzieli:

Podział Przykłady
'train' 853,422
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'et': Text(shape=(), dtype=tf.string),
})

para_crawl/enfi

  • Opis config: zbiór danych Tłumaczenie z języka angielskiego do Internetu.

  • Wielkość pliku: 151.83 MiB

  • Zbiór danych rozmiar: 543.85 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 2 156 069
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

para_crawl/enfr

  • Opis config: zbiór danych Tłumaczenie z języka angielskiego ks.

  • Wielkość pliku: 2.63 GiB

  • Zbiór danych rozmiar: 9.04 GiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 31 374 161
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fr': Text(shape=(), dtype=tf.string),
})

para_crawl/enga

  • Opis config: zbiór danych Tłumaczenie z angielskiego na ga.

  • Wielkość pliku: 28.03 MiB

  • Zbiór danych rozmiar: 107.09 MiB

  • Auto-buforowane ( dokumentacja ): Tak

  • dzieli:

Podział Przykłady
'train' 357,399
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ga': Text(shape=(), dtype=tf.string),
})

para_crawl/enhr

  • Opis config: zbiór danych Tłumaczenie z angielskiego na godzinę.

  • Wielkość pliku: 80.97 MiB

  • Zbiór danych rozmiar: 256.37 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 1 002 053
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hr': Text(shape=(), dtype=tf.string),
})

para_crawl/enhu

  • Opis config: zbiór danych Tłumaczenie z angielskiego na hu.

  • Wielkość pliku: 114.24 MiB

  • Zbiór danych rozmiar: 421.40 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 1 901 342
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'hu': Text(shape=(), dtype=tf.string),
})

para_crawl/enit

  • Opis config: zbiór danych Tłumaczenie z języka angielskiego na niego.

  • Wielkość pliku: 1017.30 MiB

  • Zbiór danych rozmiar: 3.36 GiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 12 162 239
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'it': Text(shape=(), dtype=tf.string),
})

para_crawl/enlt

  • Opis config: zbiór danych Tłumaczenie z angielskiego na LT.

  • Wielkość pliku: 63.28 MiB

  • Zbiór danych rozmiar: 204.70 MiB

  • Auto-buforowane ( dokumentacja ): Tylko kiedy shuffle_files=False (pociąg)

  • dzieli:

Podział Przykłady
'train' 844 643
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lt': Text(shape=(), dtype=tf.string),
})

para_crawl/enlv

  • Opis config: zbiór danych Tłumaczenie z angielskiego na LV.

  • Wielkość pliku: 45.17 MiB

  • Zbiór danych rozmiar: 147.09 MiB

  • Auto-buforowane ( dokumentacja ): Tylko kiedy shuffle_files=False (pociąg)

  • dzieli:

Podział Przykłady
'train' 553 060
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lv': Text(shape=(), dtype=tf.string),
})

para_crawl/enmt

  • Opis config: zbiór danych Tłumaczenie z angielskiego na mt.

  • Wielkość pliku: 18.15 MiB

  • Zbiór danych rozmiar: 54.36 MiB

  • Auto-buforowane ( dokumentacja ): Tak

  • dzieli:

Podział Przykłady
'train' 195,502
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'mt': Text(shape=(), dtype=tf.string),
})

para_crawl/ennl

  • Opis config: zbiór danych Tłumaczenie z angielskiego na NL.

  • Wielkość pliku: 400.63 MiB

  • Zbiór danych rozmiar: 1.40 GiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 5,659,268
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'nl': Text(shape=(), dtype=tf.string),
})

para_crawl/enpl

  • Opis config: zbiór danych Tłumaczenie z angielskiego na pl.

  • Wielkość pliku: 257.90 MiB

  • Zbiór danych rozmiar: 885.63 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 3 503 276
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pl': Text(shape=(), dtype=tf.string),
})

para_crawl/enpt

  • Opis config: zbiór danych Tłumaczenie z języka angielskiego do pt.

  • Wielkość pliku: 608.62 MiB

  • Zbiór danych rozmiar: 2.05 GiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 8 141 940
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

para_crawl/enro

  • Opis config: zbiór danych Tłumaczenie z angielskiego na RO.

  • Wielkość pliku: 153.24 MiB

  • Zbiór danych rozmiar: 534.34 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 1 952 043
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ro': Text(shape=(), dtype=tf.string),
})

para_crawl/ensk

  • Opis config: zbiór danych Tłumaczenie z angielskiego na SK.

  • Wielkość pliku: 96.61 MiB

  • Zbiór danych rozmiar: 352.91 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 1 591 831
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sk': Text(shape=(), dtype=tf.string),
})

para_crawl/ensl

  • Opis config: zbiór danych Tłumaczenie z angielskiego na SL.

  • Wielkość pliku: 62.02 MiB

  • Zbiór danych rozmiar: 187.66 MiB

  • Auto-buforowane ( dokumentacja ): Tylko kiedy shuffle_files=False (pociąg)

  • dzieli:

Podział Przykłady
'train' 660,161
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sl': Text(shape=(), dtype=tf.string),
})

para_crawl/ensv

  • Opis config: zbiór danych Tłumaczenie z angielskiego na sv.

  • Wielkość pliku: 262.76 MiB

  • Zbiór danych rozmiar: 905.72 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 3 476 729
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'sv': Text(shape=(), dtype=tf.string),
})