ted_hrlr_translate

  • Описание :

Наборы данных, полученные из расшифровок выступлений TED, для сравнения похожих языковых пар, где одна из них является ресурсоемкой, а другая — низкоресурсной.

@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }

ted_hrlr_translate/az_to_en (конфигурация по умолчанию)

  • Описание конфигурации : перевод набора данных с az на en в виде обычного текста.

  • Размер набора данных : 1.61 MiB

  • Сплиты :

Расколоть Примеры
'test' 903
'train' 5946
'validation' 671
  • Структура функции :
Translation({
    'az': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
аз Текст нить
en Текст нить

ted_hrlr_translate/aztr_to_en

  • Описание конфигурации : набор данных перевода из az_tr в en в виде обычного текста.

  • Размер набора данных : 42.54 MiB

  • Сплиты :

Расколоть Примеры
'test' 903
'train' 188 396
'validation' 671
  • Структура функции :
Translation({
    'az_tr': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
az_tr Текст нить
en Текст нить

ted_hrlr_translate/be_to_en

  • Описание конфигурации : набор данных перевода из be в en в виде простого текста.

  • Размер набора данных : 1.47 MiB

  • Сплиты :

Расколоть Примеры
'test' 664
'train' 4509
'validation' 248
  • Структура функции :
Translation({
    'be': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
быть Текст нить
en Текст нить

ted_hrlr_translate/beru_to_ru

  • Описание конфига : Перевод набора данных из be_ru в en в виде обычного текста.

  • Размер набора данных : 62.45 MiB

  • Сплиты :

Расколоть Примеры
'test' 664
'train' 212 614
'validation' 248
  • Структура функции :
Translation({
    'be_ru': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
be_ru Текст нить
en Текст нить

ted_hrlr_translate/es_to_pt

  • Описание конфигурации : набор данных перевода из es в pt в виде обычного текста.

  • Размер набора данных : 9.62 MiB

  • Сплиты :

Расколоть Примеры
'test' 1763
'train' 44 938
'validation' 1016
  • Структура функции :
Translation({
    'es': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
эс Текст нить
пт Текст нить

ted_hrlr_translate/fr_to_pt

  • Описание конфигурации : набор данных перевода с fr на pt в виде простого текста.

  • Размер набора данных : 9.74 MiB

  • Сплиты :

Расколоть Примеры
'test' 1494
'train' 43 873
'validation' 1131
  • Структура функции :
Translation({
    'fr': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
фр Текст нить
пт Текст нить

ted_hrlr_translate/gl_to_en

  • Описание конфигурации : набор данных перевода из gl в en в виде обычного текста.

  • Размер набора данных : 2.41 MiB

  • Сплиты :

Расколоть Примеры
'test' 1007
'train' 10 017
'validation' 682
  • Структура функции :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
en Текст нить
гл Текст нить

ted_hrlr_translate/glpt_to_en

  • Описание конфигурации : набор данных перевода из gl_pt в en в виде обычного текста.

  • Размер набора данных : 12.90 MiB

  • Сплиты :

Расколоть Примеры
'test' 1007
'train' 61 802
'validation' 682
  • Структура функции :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl_pt': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
en Текст нить
gl_pt Текст нить

ted_hrlr_translate/he_to_pt

  • Описание конфигурации : набор данных перевода из he в pt в виде простого текста.

  • Размер набора данных : 11.71 MiB

  • Сплиты :

Расколоть Примеры
'test' 1623
'train' 48 511
'validation' 1145
  • Структура функции :
Translation({
    'he': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
он Текст нить
пт Текст нить

ted_hrlr_translate/it_to_pt

  • Описание конфига : Перевод датасета из него в pt в виде простого текста.

  • Размер набора данных : 9.94 MiB

  • Сплиты :

Расколоть Примеры
'test' 1669
'train' 46 259
'validation' 1162
  • Структура функции :
Translation({
    'it': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
это Текст нить
пт Текст нить

ted_hrlr_translate/pt_to_en

  • Описание конфигурации : набор данных перевода из pt в en в виде обычного текста.

  • Размер набора данных : 10.89 MiB

  • Сплиты :

Расколоть Примеры
'test' 1803
'train' 51 785
'validation' 1193
  • Структура функции :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
en Текст нить
пт Текст нить

ted_hrlr_translate/ru_to_ru

  • Описание конфига : Набор данных перевода с ru на en в виде простого текста.

  • Размер набора данных : 63.22 MiB

  • Сплиты :

Расколоть Примеры
'test' 5476
'train' 208 106
'validation' 4805
  • Структура функции :
Translation({
    'en': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
en Текст нить
RU Текст нить

ted_hrlr_translate/ru_to_pt

  • Описание конфига : Набор данных перевода с ru на pt в виде обычного текста.

  • Размер набора данных : 13.00 MiB

  • Сплиты :

Расколоть Примеры
'test' 1588
'train' 47 278
'validation' 1184
  • Структура функции :
Translation({
    'pt': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
пт Текст нить
RU Текст нить

ted_hrlr_translate/tr_to_ru

  • Описание конфигурации : набор данных перевода из tr в en в виде простого текста.

  • Размер набора данных : 42.33 MiB

  • Сплиты :

Расколоть Примеры
'test' 5029
'train' 182 450
'validation' 4045
  • Структура функции :
Translation({
    'en': Text(shape=(), dtype=string),
    'tr': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
Перевод
en Текст нить
тр Текст нить