Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

ted_hrlr_translate

  • opis:

Zestawy danych pochodzące z transkrypcji rozmów TED do porównywania podobnych par językowych, z których jedna ma duże zasoby, a druga ma niski poziom.

@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }

ted_hrlr_translate/az_to_en (konfiguracja domyślna)

  • Opis config: Tłumaczenie z zestawu danych az do pl w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 903
'train' 5946
'validation' 671
  • Cechy:
Translation({
    'az': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/aztr_to_en

  • Opis config: zbiór danych Tłumaczenie z az_tr EN w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 903
'train' 188 396
'validation' 671
  • Cechy:
Translation({
    'az_tr': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/be_to_en

  • Opis config: Tłumaczenie z zestawu danych być en w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 664
'train' 4509
'validation' 248
  • Cechy:
Translation({
    'be': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/beru_to_en

  • Opis config: zbiór danych Tłumaczenie z be_ru EN w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 664
'train' 212 614
'validation' 248
  • Cechy:
Translation({
    'be_ru': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/es_to_pt

  • Opis config: Tłumaczenie z zestawu danych es do Pt w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 1,763
'train' 44 938
'validation' 1,016
  • Cechy:
Translation({
    'es': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/fr_to_pt

  • Opis config: zbiór danych Tłumaczenie z FR do Pt w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 1,494
'train' 43 873
'validation' 1131
  • Cechy:
Translation({
    'fr': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/gl_to_en

  • Opis config: zbiór danych Tłumaczenie z gl EN w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 1007
'train' 10 017
'validation' 682
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'gl': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/glpt_to_en

  • Opis config: zbiór danych Tłumaczenie z gl_pt EN w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 1007
'train' 61 802
'validation' 682
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'gl_pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/he_to_pt

  • Opis config: Tłumaczenie z zestawu danych on do Pt w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 1623
'train' 48 511
'validation' 1145
  • Cechy:
Translation({
    'he': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/it_to_pt

  • Opis config: zbiór danych Tłumaczenie z nim do Pt w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 1669
'train' 46.259
'validation' 1,162
  • Cechy:
Translation({
    'it': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/pt_to_en

  • Opis config: zbiór danych Tłumaczenie z pkt EN w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 1,803
'train' 51 785
'validation' 1,193
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/ru_to_en

  • Opis config: Tłumaczenie z zestawu danych do en ru w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 5476
'train' 208,106
'validation' 4805
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/ru_to_pt

  • Opis config: Tłumaczenie z zestawu danych ru do Pt w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 1588
'train' 47.278
'validation' 1184
  • Cechy:
Translation({
    'pt': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

ted_hrlr_translate/tr_to_en

  • Opis config: zbiór danych Tłumaczenie z TR en w postaci zwykłego tekstu.

  • dzieli:

Podział Przykłady
'test' 5029
'train' 182 450
'validation' 4045
  • Cechy:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'tr': Text(shape=(), dtype=tf.string),
})