tatoeba

  • opis :

Te dane pochodzą z korpusu Tatoeba z soboty 2018/11/17.

Dla każdego języka wybraliśmy 1000 angielskich zdań i ich tłumaczeń, jeśli są dostępne. Sprawdź ten artykuł, aby uzyskać opis języków, ich rodzin i skryptów, a także wyniki bazowe.

Należy pamiętać, że angielskie zdania nie są identyczne dla wszystkich par językowych. Oznacza to, że wyniki nie są bezpośrednio porównywalne w różnych językach.

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
język źródłowy Tekst strunowy
zdanie_źródłowe Tekst strunowy
język docelowy Tekst strunowy
zdanie_docelowe Tekst strunowy
@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af (domyślna konfiguracja)

  • Rozmiar pliku do pobrania : 58.24 KiB

  • Rozmiar zbioru danych : 162.74 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_ar

  • Rozmiar pliku do pobrania : 70.95 KiB

  • Rozmiar zbioru danych : 175.46 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_bg

  • Rozmiar pliku do pobrania : 99.88 KiB

  • Rozmiar zbioru danych : 204.64 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_bn

  • Rozmiar pliku do pobrania : 89.55 KiB

  • Rozmiar zbioru danych : 194.24 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_de

  • Rozmiar pliku do pobrania : 103.09 KiB

  • Rozmiar zbioru danych : 207.93 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_el

  • Rozmiar pliku do pobrania : 77.11 KiB

  • Rozmiar zbioru danych : 181.65 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_es

  • Rozmiar pliku do pobrania : 70.57 KiB

  • Rozmiar zbioru danych : 175.12 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_et

  • Rozmiar pliku do pobrania : 58.33 KiB

  • Rozmiar zbioru danych : 162.85 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_eu

  • Rozmiar pliku do pobrania : 64.52 KiB

  • Rozmiar zbioru danych : 169.02 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_fa

  • Rozmiar pliku do pobrania : 91.52 KiB

  • Rozmiar zbioru danych : 196.15 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_fi

  • Rozmiar pliku do pobrania : 73.90 KiB

  • Rozmiar zbioru danych : 178.47 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_fr

  • Rozmiar pliku do pobrania : 78.14 KiB

  • Rozmiar zbioru danych : 182.68 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_he

  • Rozmiar pliku do pobrania : 81.54 KiB

  • Rozmiar zbioru danych : 186.15 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_hi

  • Rozmiar pliku do pobrania : 119.69 KiB

  • Rozmiar zbioru danych : 224.89 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_hu

  • Rozmiar pliku do pobrania : 67.27 KiB

  • Rozmiar zbioru danych : 171.78 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_id

  • Rozmiar pliku do pobrania : 73.09 KiB

  • Rozmiar zbioru danych : 177.61 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_it

  • Rozmiar pliku do pobrania : 64.29 KiB

  • Rozmiar zbioru danych : 168.81 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_ja

  • Rozmiar pliku do pobrania : 90.90 KiB

  • Rozmiar zbioru danych : 195.53 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_jv

  • Rozmiar pliku do pobrania : 13.59 KiB

  • Rozmiar zbioru danych : 35.01 KiB

  • Podziały :

Podział Przykłady
'train' 205

tatoeba/tatoeba_ka

  • Rozmiar pliku do pobrania : 70.47 KiB

  • Rozmiar zbioru danych : 148.67 KiB

  • Podziały :

Podział Przykłady
'train' 746

tatoeba/tatoeba_kk

  • Rozmiar pliku do pobrania : 46.07 KiB

  • Rozmiar zbioru danych : 106.25 KiB

  • Podziały :

Podział Przykłady
'train' 575

tatoeba/tatoeba_ko

  • Rozmiar pliku do pobrania : 77.28 KiB

  • Rozmiar zbioru danych : 181.88 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_ml

  • Rozmiar pliku do pobrania : 92.50 KiB

  • Rozmiar zbioru danych : 165.14 KiB

  • Podziały :

Podział Przykłady
'train' 687

tatoeba/tatoeba_mr

  • Rozmiar pliku do pobrania : 98.19 KiB

  • Rozmiar zbioru danych : 202.96 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_nl

  • Rozmiar pliku do pobrania : 71.55 KiB

  • Rozmiar zbioru danych : 176.10 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_pt

  • Rozmiar pliku do pobrania : 73.42 KiB

  • Rozmiar zbioru danych : 177.95 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_ru

  • Rozmiar pliku do pobrania : 90.30 KiB

  • Rozmiar zbioru danych : 194.92 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_sw

  • Rozmiar pliku do pobrania : 19.99 KiB

  • Rozmiar zestawu danych : 60.75 KiB

  • Podziały :

Podział Przykłady
'train' 390

tatoeba/tatoeba_ta

  • Rozmiar pliku do pobrania : 38.52 KiB

  • Rozmiar zbioru danych : 70.93 KiB

  • Podziały :

Podział Przykłady
'train' 307

tatoeba/tatoeba_te

  • Rozmiar pliku do pobrania : 24.55 KiB

  • Rozmiar zbioru danych : 49.07 KiB

  • Podziały :

Podział Przykłady
'train' 234

tatoeba/tatoeba_th

  • Rozmiar pliku do pobrania : 61.72 KiB

  • Rozmiar zbioru danych : 119.32 KiB

  • Podziały :

Podział Przykłady
'train' 548

tatoeba/tatoeba_tl

  • Rozmiar pliku do pobrania : 66.54 KiB

  • Rozmiar zbioru danych : 171.04 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_tr

  • Rozmiar pliku do pobrania : 70.20 KiB

  • Rozmiar zbioru danych : 174.70 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_ur

  • Rozmiar pliku do pobrania : 86.63 KiB

  • Rozmiar zbioru danych : 191.20 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_vi

  • Rozmiar pliku do pobrania : 89.26 KiB

  • Rozmiar zbioru danych : 193.89 KiB

  • Podziały :

Podział Przykłady
'train' 1000

tatoeba/tatoeba_zh

  • Rozmiar pliku do pobrania : 67.32 KiB

  • Rozmiar zbioru danych : 171.85 KiB

  • Podziały :

Podział Przykłady
'train' 1000