tatoeba

  • Descrizione :

Questi dati sono estratti dal corpus di Tatoeba, datato sabato 2018/11/17.

Per ogni lingua, abbiamo selezionato 1000 frasi inglesi e le loro traduzioni, se disponibili. Si prega di controllare questo documento per una descrizione delle lingue, delle loro famiglie e scritture, nonché dei risultati di riferimento.

Si noti che le frasi in inglese non sono identiche per tutte le combinazioni linguistiche. Ciò significa che i risultati non sono direttamente confrontabili tra le lingue.

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
linguaggio del codice Testo corda
frase_fonte Testo corda
lingua di destinazione Testo corda
target_frase Testo corda
@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af (configurazione predefinita)

  • Dimensione del download : 58.24 KiB

  • Dimensione del set di dati: 162.74 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_ar

  • Dimensione del download : 70.95 KiB

  • Dimensione del set di dati: 175.46 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_bg

  • Dimensione del download : 99.88 KiB

  • Dimensione del set di dati: 204.64 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_bn

  • Dimensione del download : 89.55 KiB

  • Dimensione del set di dati: 194.24 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_de

  • Dimensione del download : 103.09 KiB

  • Dimensione del set di dati: 207.93 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_el

  • Dimensione del download : 77.11 KiB

  • Dimensione del set di dati: 181.65 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_es

  • Dimensione del download : 70.57 KiB

  • Dimensione del set di dati: 175.12 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_et

  • Dimensione del download : 58.33 KiB

  • Dimensione del set di dati: 162.85 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_eu

  • Dimensione del download : 64.52 KiB

  • Dimensione del set di dati: 169.02 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_fa

  • Dimensione del download : 91.52 KiB

  • Dimensione del set di dati: 196.15 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_fi

  • Dimensione del download : 73.90 KiB

  • Dimensione del set di dati: 178.47 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_fr

  • Dimensione del download : 78.14 KiB

  • Dimensione del set di dati: 182.68 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_he

  • Dimensione del download : 81.54 KiB

  • Dimensione del set di dati: 186.15 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_ciao

  • Dimensione del download : 119.69 KiB

  • Dimensione del set di dati: 224.89 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_hu

  • Dimensione del download : 67.27 KiB

  • Dimensione del set di dati: 171.78 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_id

  • Dimensione del download : 73.09 KiB

  • Dimensione del set di dati: 177.61 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_it

  • Dimensione del download : 64.29 KiB

  • Dimensione del set di dati: 168.81 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_ja

  • Dimensione del download : 90.90 KiB

  • Dimensione del set di dati: 195.53 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_jv

  • Dimensione del download : 13.59 KiB

  • Dimensione del set di dati: 35.01 KiB

  • Divisioni :

Diviso Esempi
'train' 205

tatoeba/tatoeba_ka

  • Dimensione del download : 70.47 KiB

  • Dimensione del set di dati: 148.67 KiB

  • Divisioni :

Diviso Esempi
'train' 746

tatoeba/tatoeba_kk

  • Dimensione del download : 46.07 KiB

  • Dimensione del set di dati: 106.25 KiB

  • Divisioni :

Diviso Esempi
'train' 575

tatoeba/tatoeba_ko

  • Dimensione del download : 77.28 KiB

  • Dimensione del set di dati: 181.88 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_ml

  • Dimensione del download : 92.50 KiB

  • Dimensione del set di dati: 165.14 KiB

  • Divisioni :

Diviso Esempi
'train' 687

tatoeba/tatoeba_mr

  • Dimensione del download : 98.19 KiB

  • Dimensione del set di dati: 202.96 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_nl

  • Dimensione del download : 71.55 KiB

  • Dimensione del set di dati: 176.10 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_pt

  • Dimensione del download : 73.42 KiB

  • Dimensione del set di dati: 177.95 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_ru

  • Dimensione del download : 90.30 KiB

  • Dimensione del set di dati: 194.92 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_sw

  • Dimensione del download : 19.99 KiB

  • Dimensione del set di dati: 60.75 KiB

  • Divisioni :

Diviso Esempi
'train' 390

tatoeba/tatoeba_ta

  • Dimensione del download : 38.52 KiB

  • Dimensione del set di dati: 70.93 KiB

  • Divisioni :

Diviso Esempi
'train' 307

tatoeba/tatoeba_te

  • Dimensione del download : 24.55 KiB

  • Dimensione del set di dati: 49.07 KiB

  • Divisioni :

Diviso Esempi
'train' 234

tatoeba/tatoeba_th

  • Dimensione del download : 61.72 KiB

  • Dimensione del set di dati: 119.32 KiB

  • Divisioni :

Diviso Esempi
'train' 548

tatoeba/tatoeba_tl

  • Dimensione del download : 66.54 KiB

  • Dimensione del set di dati: 171.04 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_tr

  • Dimensione del download : 70.20 KiB

  • Dimensione del set di dati: 174.70 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_ur

  • Dimensione del download : 86.63 KiB

  • Dimensione del set di dati: 191.20 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_vi

  • Dimensione del download : 89.26 KiB

  • Dimensione del set di dati: 193.89 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000

tatoeba/tatoeba_zh

  • Dimensione del download : 67.32 KiB

  • Dimensione del set di dati: 171.85 KiB

  • Divisioni :

Diviso Esempi
'train' 1.000