- Описание:
Параллельные корпуса веб-масштаба для официальных европейских языков.
Домашняя страница: https://paracrawl.eu/releases.html
Исходный код:
tfds.translate.ParaCrawl
Версии:
-
1.2.0
( по умолчанию): Нет Замечания к выпуску.
-
Рис ( tfds.show_examples ): Не поддерживается.
Образец цитирования:
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl / enbg (конфигурация по умолчанию)
Описание Config: Перевод с английского набором данных на Б.Г..
Скачать Размер:
98.94 MiB
Dataset Размер:
362.46 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 1 039 885 |
- Особенности:
Translation({
'bg': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'bg')
Примеры ( tfds.as_dataframe ):
para_crawl / encs
Описание Config: Перевод с английского набора данных для сСт.
Скачать Размер:
187.31 MiB
Dataset Размер:
666.34 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 2 981 949 |
- Особенности:
Translation({
'cs': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'cs')
Примеры ( tfds.as_dataframe ):
para_crawl / enda
Описание Config: Перевод с английского набора данных к да.
Скачать Размер:
174.34 MiB
Dataset Размер:
619.77 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 2 414 895 |
- Особенности:
Translation({
'da': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'da')
Примеры ( tfds.as_dataframe ):
para_crawl / ende
Описание Config: Перевод с английского набором данных для снятия.
Скачать Размер:
1.22 GiB
Dataset Размер:
4.04 GiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 16 264 448 |
- Особенности:
Translation({
'de': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (См
as_supervised
документ ):('en', 'de')
Примеры ( tfds.as_dataframe ):
para_crawl / enel
Описание Config: Перевод с английского набора данных на эл.
Скачать Размер:
184.59 MiB
Dataset Размер:
698.75 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 1 985 233 |
- Особенности:
Translation({
'el': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'el')
Примеры ( tfds.as_dataframe ):
para_crawl / enes
Описание Config: Перевод с английского набора данных для эс.
Скачать Размер:
1.82 GiB
Dataset Размер:
6.23 GiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 21 987 267 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'es': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'es')
Примеры ( tfds.as_dataframe ):
para_crawl / enet
Описание Config: Перевод с английского набора данных на ЕТ.
Скачать Размер:
66.91 MiB
Dataset Размер:
209.16 MiB
Авто-кэшируются ( документация ): Только при
shuffle_files=False
(поезд)расколы:
Расколоть | Примеры |
---|---|
'train' | 853 422 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'et': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (См
as_supervised
документ ):('en', 'et')
и('en', 'et')
Примеры ( tfds.as_dataframe ):
para_crawl / enfi
Описание Config: Перевод с английского набора данных для фи.
Скачать Размер:
151.83 MiB
Dataset Размер:
543.85 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 2 156 069 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'fi': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'fi')
Примеры ( tfds.as_dataframe ):
para_crawl / enfr
Описание Config: Перевод с английского набором данных для фра.
Скачать Размер:
2.63 GiB
Dataset Размер:
9.04 GiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 31 374 161 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'fr': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'fr')
Примеры ( tfds.as_dataframe ):
para_crawl / enga
Описание Config: Перевод с английского набора данных для га.
Скачать Размер:
28.03 MiB
Dataset Размер:
107.09 MiB
Авто-кэшируются ( документация ): Да
расколы:
Расколоть | Примеры |
---|---|
'train' | 357 399 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'ga': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'ga')
Примеры ( tfds.as_dataframe ):
para_crawl / enhr
Описание Config: Перевод с английского набора данных в час.
Скачать Размер:
80.97 MiB
Dataset Размер:
256.37 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 1 002 053 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'hr': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'hr')
Примеры ( tfds.as_dataframe ):
para_crawl / enhu
Описание Config: Перевод с английского набора данных для Hu.
Скачать Размер:
114.24 MiB
Dataset Размер:
421.40 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 1 901 342 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'hu': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (См
as_supervised
документа ):('en', 'hu')
Примеры ( tfds.as_dataframe ):
para_crawl / enit
Описание Config: Перевод с английского набора данных к нему.
Скачать Размер:
1017.30 MiB
Dataset Размер:
3.36 GiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 12 162 239 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'it': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'it')
Примеры ( tfds.as_dataframe ):
para_crawl / enlt
Описание Config: Перевод с английского набора данных для лт.
Скачать Размер:
63.28 MiB
Dataset Размер:
204.70 MiB
Авто-кэшируются ( документация ): Только при
shuffle_files=False
(поезд)расколы:
Расколоть | Примеры |
---|---|
'train' | 844 643 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'lt': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (См
as_supervised
документ ):('en', 'lt')
Примеры ( tfds.as_dataframe ):
para_crawl / enlv
Описание Config: Перевод с английского набором данных на ЛВ.
Скачать Размер:
45.17 MiB
Dataset Размер:
147.09 MiB
Авто-кэшируются ( документация ): Только при
shuffle_files=False
(поезд)расколы:
Расколоть | Примеры |
---|---|
'train' | 553 060 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'lv': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'lv')
Примеры ( tfds.as_dataframe ):
para_crawl / enmt
Описание Config: Перевод с английского набора данных на мт.
Скачать Размер:
18.15 MiB
Dataset Размер:
54.36 MiB
Авто-кэшируются ( документация ): Да
расколы:
Расколоть | Примеры |
---|---|
'train' | 195 502 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'mt': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'mt')
Примеры ( tfds.as_dataframe ):
para_crawl / ennl
Описание Config: Перевод с английского набором данных Н.Л..
Скачать Размер:
400.63 MiB
Dataset Размер:
1.40 GiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 5 659 268 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'nl': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (См
as_supervised
документ ):('en', 'nl')
Примеры ( tfds.as_dataframe ):
para_crawl / enpl
Описание Config: Перевод набора данных с Английский на пл.
Скачать Размер:
257.90 MiB
Dataset Размер:
885.63 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 3 503 276 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'pl': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'pl')
Примеры ( tfds.as_dataframe ):
para_crawl / enpt
Описание Config: Перевод с английского набора данных в пт.
Скачать Размер:
608.62 MiB
Dataset Размер:
2.05 GiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 8 141 940 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'pt')
Примеры ( tfds.as_dataframe ):
para_crawl / enro
Описание Config: Перевод с английского набором данных ро.
Скачать Размер:
153.24 MiB
Dataset Размер:
534.34 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 1 952 043 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'ro': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'ro')
Примеры ( tfds.as_dataframe ):
para_crawl / ensk
Описание Config: Перевод с английского набором данных на Sk.
Скачать Размер:
96.61 MiB
Dataset Размер:
352.91 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 1 591 831 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'sk': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'sk')
Примеры ( tfds.as_dataframe ):
para_crawl / ensl
Описание Config: Перевод с английского набора данных на сл.
Скачать Размер:
62.02 MiB
Dataset Размер:
187.66 MiB
Авто-кэшируются ( документация ): Только при
shuffle_files=False
(поезд)расколы:
Расколоть | Примеры |
---|---|
'train' | 660 161 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'sl': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'sl')
Примеры ( tfds.as_dataframe ):
para_crawl / ensv
Описание Config: Перевод с английского набором данных С.
Скачать Размер:
262.76 MiB
Dataset Размер:
905.72 MiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'train' | 3 476 729 |
- Особенности:
Translation({
'en': Text(shape=(), dtype=tf.string),
'sv': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):('en', 'sv')
Примеры ( tfds.as_dataframe ):