- Описание :
Параллельные веб-корпуса для официальных европейских языков.
Домашняя страница : https://paracrawl.eu/releases.html
Исходный код :
tfds.translate.ParaCrawl
Версии :
-
1.2.0
(по умолчанию): без примечаний к выпуску.
-
Цитата :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
- Рисунок ( tfds.show_examples ): не поддерживается.
para_crawl / enbg (конфигурация по умолчанию)
Описание конфигурации : Перевод набора данных с английского на bg.
Размер загрузки :
98.94 MiB
Размер набора данных :
362.46 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 1 039 885 |
- Особенности :
Translation({
'bg': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('en', 'bg')
Примеры ( tfds.as_dataframe ):
para_crawl / encs
Описание конфигурации : Перевод набора данных с английского на cs.
Размер загрузки :
187.31 MiB
Размер набора данных :
666.34 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 2 981 949 |
- Особенности :
Translation({
'cs': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('en', 'cs')
Примеры ( tfds.as_dataframe ):
para_crawl / enda
Описание конфигурации : Перевод набора данных с английского на да.
Размер загрузки :
174.34 MiB
Размер набора данных :
619.77 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 2 414 895 |
- Особенности :
Translation({
'da': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'da')
Примеры ( tfds.as_dataframe ):
para_crawl / ende
Описание конфигурации : Перевод набора данных с английского на de.
Размер загружаемого файла :
1.22 GiB
Размер набора данных :
4.04 GiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 16 264 448 |
- Особенности :
Translation({
'de': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('en', 'de')
Примеры ( tfds.as_dataframe ):
para_crawl / enel
Описание конфигурации : Перевод набора данных с английского на эл.
Размер загрузки :
184.59 MiB
Размер набора данных :
698.75 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 1 985 233 |
- Особенности :
Translation({
'el': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'el')
Примеры ( tfds.as_dataframe ):
para_crawl / enes
Описание конфигурации : Перевод набора данных с английского на es.
Размер загружаемого файла :
1.82 GiB
Размер набора данных :
6.23 GiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 21 987 267 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'es': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('en', 'es')
Примеры ( tfds.as_dataframe ):
para_crawl / enet
Описание конфигурации : перевод набора данных с английского языка на другой.
Размер загрузки :
66.91 MiB
Размер набора данных :
209.16 MiB
Автоматическое кэширование ( документация ): только когда
shuffle_files=False
(поезд)Сплит :
Трещина | Примеры |
---|---|
'train' | 853 422 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'et': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('en', 'et')
Примеры ( tfds.as_dataframe ):
para_crawl / enfi
Описание конфигурации : Перевод набора данных с английского на фи.
Размер загрузки :
151.83 MiB
Размер набора данных :
543.85 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 2 156 069 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'fi': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'fi')
Примеры ( tfds.as_dataframe ):
para_crawl / enfr
Описание конфигурации : Перевод набора данных с английского на фр.
Размер загружаемого файла :
2.63 GiB
Размер набора данных :
9.04 GiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 31 374 161 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'fr': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'fr')
Примеры ( tfds.as_dataframe ):
para_crawl / enga
Описание конфигурации : Перевод набора данных с английского языка на ga.
Размер загрузки :
28.03 MiB
Размер набора данных :
107.09 MiB
Автоматическое кэширование ( документация ): Да
Сплит :
Трещина | Примеры |
---|---|
'train' | 357 399 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ga': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'ga')
Примеры ( tfds.as_dataframe ):
para_crawl / enhr
Описание конфигурации : Перевод набора данных с английского на hr.
Размер загрузки :
80.97 MiB
Размер набора данных :
256.37 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 1 002 053 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'hr': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'hr')
Примеры ( tfds.as_dataframe ):
para_crawl / enhu
Описание конфигурации : Перевод набора данных с английского на hu.
Размер загрузки :
114.24 MiB
Размер набора данных :
421.40 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 1 901 342 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'hu': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'hu')
Примеры ( tfds.as_dataframe ):
para_crawl / enit
Описание конфигурации : Перевод набора данных с английского на него.
Размер загрузки :
1017.30 MiB
Размер набора данных :
3.36 GiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 12 162 239 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'it': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'it')
Примеры ( tfds.as_dataframe ):
para_crawl / enlt
Описание конфигурации : Перевод набора данных с английского на lt.
Размер загрузки :
63.28 MiB
Размер набора данных :
204.70 MiB
Автоматическое кэширование ( документация ): только когда
shuffle_files=False
(поезд)Сплит :
Трещина | Примеры |
---|---|
'train' | 844 643 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'lt': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'lt')
Примеры ( tfds.as_dataframe ):
para_crawl / enlv
Описание конфигурации : Перевод набора данных с английского на lv.
Размер загрузки :
45.17 MiB
Размер набора данных :
147.09 MiB
Автоматическое кэширование ( документация ): только когда
shuffle_files=False
(поезд)Сплит :
Трещина | Примеры |
---|---|
'train' | 553 060 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'lv': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('en', 'lv')
Примеры ( tfds.as_dataframe ):
para_crawl / enmt
Описание конфигурации : Перевод набора данных с английского на mt.
Размер загрузки :
18.15 MiB
Размер набора данных :
54.36 MiB
Автоматическое кэширование ( документация ): Да
Сплит :
Трещина | Примеры |
---|---|
'train' | 195 502 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'mt': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'mt')
Примеры ( tfds.as_dataframe ):
para_crawl / ennl
Описание конфигурации : Перевод набора данных с английского на nl.
Размер загрузки :
400.63 MiB
Размер набора данных :
1.40 GiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 5 659 268 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'nl': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'nl')
Примеры ( tfds.as_dataframe ):
para_crawl / enpl
Описание конфигурации : Перевод набора данных с английского на pl.
Размер загрузки :
257.90 MiB
Размер набора данных :
885.63 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 3 503 276 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'pl': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'pl')
Примеры ( tfds.as_dataframe ):
para_crawl / enpt
Описание конфигурации : Перевод набора данных с английского на pt.
Размер загрузки :
608.62 MiB
Размер набора данных :
2.05 GiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 8 141 940 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('en', 'pt')
Примеры ( tfds.as_dataframe ):
para_crawl / enro
Описание конфигурации : Перевод набора данных с английского на ro.
Размер загрузки :
153.24 MiB
Размер набора данных :
534.34 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 1 952 043 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ro': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'ro')
Примеры ( tfds.as_dataframe ):
para_crawl / ensk
Описание конфигурации : Перевод набора данных с английского на ск.
Размер загрузки :
96.61 MiB
Размер набора данных :
352.91 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 1 591 831 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'sk': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('en', 'sk')
Примеры ( tfds.as_dataframe ):
para_crawl / ensl
Описание конфигурации : Перевод набора данных с английского на сл.
Размер загрузки :
62.02 MiB
Размер набора данных :
187.66 MiB
Автоматическое кэширование ( документация ): только когда
shuffle_files=False
(поезд)Сплит :
Трещина | Примеры |
---|---|
'train' | 660 161 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'sl': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'sl')
Примеры ( tfds.as_dataframe ):
para_crawl / ensv
Описание конфигурации : Перевод набора данных с английского на св.
Размер загрузки :
262.76 MiB
Размер набора данных :
905.72 MiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'train' | 3 476 729 |
- Особенности :
Translation({
'en': Text(shape=(), dtype=tf.string),
'sv': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('en', 'sv')
Примеры ( tfds.as_dataframe ):