para_crawl

  • opis :

Korpusy równoległe w skali sieciowej dla oficjalnych języków europejskich.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (domyślna konfiguracja)

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na bg.

  • Rozmiar pliku do pobrania : 98.94 MiB

  • Rozmiar zestawu danych : 362.46 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 1 039 885
  • Struktura funkcji :
Translation({
    'bg': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
bg Tekst strunowy
en Tekst strunowy

para_crawl/encs

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na cs.

  • Rozmiar pliku do pobrania : 187.31 MiB

  • Rozmiar zestawu danych : 666.34 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 2 981 949
  • Struktura funkcji :
Translation({
    'cs': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
cs Tekst strunowy
en Tekst strunowy

para_crawl/enda

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na da.

  • Rozmiar pliku do pobrania : 174.34 MiB

  • Rozmiar zbioru danych : 619.77 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 2414895
  • Struktura funkcji :
Translation({
    'da': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
da Tekst strunowy
en Tekst strunowy

para_crawl/ende

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na de.

  • Rozmiar pliku do pobrania : 1.22 GiB

  • Rozmiar zestawu danych : 4.04 GiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 16 264 448
  • Struktura funkcji :
Translation({
    'de': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
de Tekst strunowy
en Tekst strunowy

para_crawl/enel

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na el.

  • Rozmiar pliku do pobrania : 184.59 MiB

  • Rozmiar zestawu danych : 698.75 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 1 985 233
  • Struktura funkcji :
Translation({
    'el': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
el Tekst strunowy
en Tekst strunowy

para_crawl/enes

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na es.

  • Rozmiar pliku do pobrania : 1.82 GiB

  • Rozmiar zestawu danych : 6.23 GiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 21 987 267
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'es': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
es Tekst strunowy

para_crawl/enet

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na et.

  • Rozmiar pliku do pobrania : 66.91 MiB

  • Rozmiar zestawu danych : 209.16 MiB

  • Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy shuffle_files=False (pociąg)

  • Podziały :

Rozdzielać Przykłady
'train' 853422
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'et': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
et Tekst strunowy

para_crawl/enfi

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na fi.

  • Rozmiar pliku do pobrania : 151.83 MiB

  • Rozmiar zbioru danych : 543.85 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 2156069
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'fi': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
fi Tekst strunowy

para_crawl/enfr

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na fr.

  • Rozmiar pliku do pobrania : 2.63 GiB

  • Rozmiar zestawu danych : 9.04 GiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 31 374 161
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'fr': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
fr Tekst strunowy

para_crawl/enga

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na ga.

  • Rozmiar pliku do pobrania : 28.03 MiB

  • Rozmiar zestawu danych : 107.09 MiB

  • Automatyczne buforowanie ( dokumentacja ): Tak

  • Podziały :

Rozdzielać Przykłady
'train' 357399
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'ga': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
ga Tekst strunowy

para_crawl/enhr

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na hr.

  • Rozmiar pliku do pobrania : 80.97 MiB

  • Rozmiar zestawu danych : 256.37 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 1 002 053
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'hr': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
godz Tekst strunowy

para_crawl/enhu

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na hu.

  • Rozmiar pliku do pobrania : 114.24 MiB

  • Rozmiar zestawu danych : 421.40 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 1 901 342
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'hu': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
hu Tekst strunowy

para_crawl/enit

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na to.

  • Rozmiar pliku do pobrania : 1017.30 MiB

  • Rozmiar zestawu danych : 3.36 GiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 12 162 239
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'it': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
to Tekst strunowy

para_crawl/enlt

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na lt.

  • Rozmiar pliku do pobrania : 63.28 MiB

  • Rozmiar zestawu danych : 204.70 MiB

  • Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy shuffle_files=False (pociąg)

  • Podziały :

Rozdzielać Przykłady
'train' 844643
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'lt': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
lt Tekst strunowy

para_crawl/enlv

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na lv.

  • Rozmiar pliku do pobrania : 45.17 MiB

  • Rozmiar zestawu danych : 147.09 MiB

  • Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy shuffle_files=False (pociąg)

  • Podziały :

Rozdzielać Przykłady
'train' 553.060
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'lv': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
lv Tekst strunowy

para_crawl/enmt

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na mt.

  • Rozmiar pliku do pobrania : 18.15 MiB

  • Rozmiar zestawu danych : 54.36 MiB

  • Automatyczne buforowanie ( dokumentacja ): Tak

  • Podziały :

Rozdzielać Przykłady
'train' 195502
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'mt': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
góra Tekst strunowy

para_crawl/ennl

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na nl.

  • Rozmiar pliku do pobrania : 400.63 MiB

  • Rozmiar zestawu danych : 1.40 GiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 5 659 268
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'nl': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
nl Tekst strunowy

para_crawl/enpl

  • Opis konfiguracji : Zestaw danych do tłumaczenia z angielskiego na pl.

  • Rozmiar pliku do pobrania : 257.90 MiB

  • Rozmiar zestawu danych : 885.63 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 3503276
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'pl': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
pl Tekst strunowy

para_crawl/enpt

  • Opis konfiguracji : Zestaw danych do tłumaczenia z angielskiego na pt.

  • Rozmiar pliku do pobrania : 608.62 MiB

  • Rozmiar zestawu danych : 2.05 GiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 8141940
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
pkt Tekst strunowy

para_crawl/enro

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na ro.

  • Rozmiar pliku do pobrania : 153.24 MiB

  • Rozmiar zbioru danych : 534.34 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 1 952 043
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'ro': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
ro Tekst strunowy

para_crawl/ensk

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na sk.

  • Rozmiar pliku do pobrania : 96.61 MiB

  • Rozmiar zestawu danych : 352.91 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 1 591 831
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'sk': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
sk Tekst strunowy

para_crawl/enl

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na sl.

  • Rozmiar pliku do pobrania : 62.02 MiB

  • Rozmiar zestawu danych : 187.66 MiB

  • Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy shuffle_files=False (pociąg)

  • Podziały :

Rozdzielać Przykłady
'train' 660161
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'sl': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
śl Tekst strunowy

para_crawl/env

  • Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na sv.

  • Rozmiar pliku do pobrania : 262.76 MiB

  • Rozmiar zbioru danych : 905.72 MiB

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Podziały :

Rozdzielać Przykłady
'train' 3 476 729
  • Struktura funkcji :
Translation({
    'en': Text(shape=(), dtype=string),
    'sv': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
Tłumaczenie
en Tekst strunowy
św Tekst strunowy