Эта страница была переведа с помощью Cloud Translation API.
Switch to English

опус

  • Домашняя страница : http://opus.nlpl.eu/

  • Исходный код : tfds.translate.Opus

  • Версии :

    • 0.1.0 (по умолчанию): без примечаний к выпуску.
  • Особенности :

Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})
  • Контролируемые ключи (см. as_supervised doc ): ('de', 'en')

  • Цитата :

@inproceedings{Tiedemann2012ParallelData,
  author = {Tiedemann, J},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {LREC}
  year = {2012} }

opus / medical (конфигурация по умолчанию)

  • Описание :

OPUS - это коллекция переведенных текстов из Интернета.

Создайте свою собственную конфигурацию, чтобы выбрать, какую пару данных / языка загружать.

config = tfds.translate.opus.OpusConfig(
    version=tfds.core.Version('0.1.0'),
    language_pair=("de", "en"),
    subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)

медицинские документы

  • Описание конфигурации : медицинские документы

  • Размер загрузки : 34.29 MiB

  • Размер набора данных : 188.85 MiB

  • Автоматическое кэширование ( документация ): только когда shuffle_files=False (поезд)

  • Сплит :

Трещина Примеры
'train' 1 108 752

опус / закон

  • Описание :

OPUS - это коллекция переведенных текстов из Интернета.

Создайте свою собственную конфигурацию, чтобы выбрать, какую пару данных / языка загружать.

config = tfds.translate.opus.OpusConfig(
    version=tfds.core.Version('0.1.0'),
    language_pair=("de", "en"),
    subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)

юридические документы

  • Описание конфигурации : юридические документы

  • Размер загружаемого 46.99 MiB : 46.99 MiB

  • Размер набора данных : 214.44 MiB

  • Автоматическое кэширование ( документация ): только когда shuffle_files=False (поезд)

  • Сплит :

Трещина Примеры
'train' 719 372

opus / koran

  • Описание :

OPUS - это коллекция переведенных текстов из Интернета.

Создайте свою собственную конфигурацию, чтобы выбрать, какую пару данных / языка загружать.

config = tfds.translate.opus.OpusConfig(
    version=tfds.core.Version('0.1.0'),
    language_pair=("de", "en"),
    subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)

коранические документы

  • Описание конфигурации : коранические документы

  • Размер загрузки : 35.42 MiB

  • Размер набора данных : 117.54 MiB

  • Автоматическое кэширование ( документация ): Да

  • Сплит :

Трещина Примеры
'train' 537 128

opus / IT

  • Описание :

OPUS - это коллекция переведенных текстов из Интернета.

Создайте свою собственную конфигурацию, чтобы выбрать, какую пару данных / языка загружать.

config = tfds.translate.opus.OpusConfig(
    version=tfds.core.Version('0.1.0'),
    language_pair=("de", "en"),
    subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)

ИТ-документы

  • Описание конфигурации : ИТ-документы

  • Размер загрузки : 10.33 MiB

  • Размер набора данных : 42.51 MiB

  • Автоматическое кэширование ( документация ): Да

  • Сплит :

Трещина Примеры
'train' 347 817

опусы / субтитры

  • Описание :

OPUS - это коллекция переведенных текстов из Интернета.

Создайте свою собственную конфигурацию, чтобы выбрать, какую пару данных / языка загружать.

config = tfds.translate.opus.OpusConfig(
    version=tfds.core.Version('0.1.0'),
    language_pair=("de", "en"),
    subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)

субтитры документы

  • Описание конфигурации : субтитры документов

  • Размер загрузки : 677.64 MiB

  • Размер набора данных : 2.01 GiB

  • Автоматическое кэширование ( документация ): Нет

  • Сплит :

Трещина Примеры
'train' 22 512 639