- توضیحات :
شرکتهای موازی مقیاس وب برای زبانهای رسمی اروپایی.
صفحه اصلی : https://paracrawl.eu/releases.html
کد منبع :
tfds.translate.ParaCrawl
نسخه ها :
-
1.2.0
(پیش فرض): بدون یادداشت انتشار.
-
نقل قول :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
- شکل ( tfds.show_examples ): پشتیبانی نمی شود.
para_crawl / enbg (پیکربندی پیش فرض)
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به bg.
حجم
98.94 MiB
:98.94 MiB
اندازه مجموعه داده :
362.46 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 1،039،885 |
- ویژگی ها :
Translation({
'bg': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'bg')
مثالها ( tfds.as_dataframe ):
para_crawl / encs
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به cs.
حجم دانلود :
187.31 MiB
اندازه مجموعه داده :
666.34 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 2،981،949 |
- ویژگی ها :
Translation({
'cs': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'cs')
مثالها ( tfds.as_dataframe ):
para_crawl / enda
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به da.
حجم دانلود :
174.34 MiB
اندازه مجموعه داده :
619.77 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 2،414،895 |
- ویژگی ها :
Translation({
'da': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'da')
مثالها ( tfds.as_dataframe ):
para_crawl / ende
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به de.
اندازه بارگیری :
1.22 GiB
اندازه مجموعه داده :
4.04 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 16،264،448 |
- ویژگی ها :
Translation({
'de': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'de')
مثالها ( tfds.as_dataframe ):
para_crawl / enel
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به el.
حجم
184.59 MiB
:184.59 MiB
اندازه مجموعه داده :
698.75 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 1،985،233 |
- ویژگی ها :
Translation({
'el': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'el')
مثالها ( tfds.as_dataframe ):
para_crawl / enes
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به es.
اندازه بارگیری :
1.82 GiB
اندازه مجموعه داده :
6.23 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 21،987،267 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'es': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'es')
مثالها ( tfds.as_dataframe ):
para_crawl / enet
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به et.
اندازه بارگیری :
66.91 MiB
اندازه مجموعه داده :
209.16 MiB
ذخیره خودکار ( مستندات ): فقط وقتی
shuffle_files=False
(قطار)تقسیم :
شکاف | مثال ها |
---|---|
'train' | 853،422 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'et': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'et')
مثالها ( tfds.as_dataframe ):
para_crawl / enfi
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به fi.
اندازه
151.83 MiB
:151.83 MiB
اندازه مجموعه داده :
543.85 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 2،156،069 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'fi': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'fi')
مثالها ( tfds.as_dataframe ):
para_crawl / enfr
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به fr.
اندازه بارگیری :
2.63 GiB
اندازه مجموعه داده :
9.04 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 31،374،161 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'fr': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'fr')
مثالها ( tfds.as_dataframe ):
para_crawl / enga
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به ga.
حجم دانلود :
28.03 MiB
اندازه مجموعه داده :
107.09 MiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 357،399 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ga': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'ga')
مثالها ( tfds.as_dataframe ):
para_crawl / enhr
شرح پیکربندی : مجموعه داده ترجمه شده از انگلیسی به hr.
حجم دانلود :
80.97 MiB
اندازه مجموعه داده :
256.37 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 1،002،053 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'hr': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'hr')
مثالها ( tfds.as_dataframe ):
para_crawl / enhu
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به hu.
حجم
114.24 MiB
:114.24 MiB
اندازه مجموعه داده :
421.40 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 1،901،342 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'hu': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'hu')
مثالها ( tfds.as_dataframe ):
para_crawl / enit
شرح پیکربندی : مجموعه داده ترجمه شده از انگلیسی به آن.
اندازه
1017.30 MiB
:1017.30 MiB
اندازه مجموعه داده :
3.36 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 12،162،239 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'it': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'it')
مثالها ( tfds.as_dataframe ):
para_crawl / enlt
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به lt.
حجم بارگیری :
63.28 MiB
اندازه مجموعه داده :
204.70 MiB
ذخیره خودکار ( مستندات ): فقط وقتی
shuffle_files=False
(قطار)تقسیم :
شکاف | مثال ها |
---|---|
'train' | 844،643 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'lt': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'lt')
مثالها ( tfds.as_dataframe ):
para_crawl / enlv
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به lv.
اندازه بارگیری :
45.17 MiB
اندازه مجموعه داده :
147.09 MiB
ذخیره خودکار ( مستندات ): فقط وقتی
shuffle_files=False
(قطار)تقسیم :
شکاف | مثال ها |
---|---|
'train' | 553،060 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'lv': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'lv')
مثالها ( tfds.as_dataframe ):
para_crawl / enmt
شرح پیکربندی : مجموعه داده ترجمه شده از انگلیسی به mt.
اندازه بارگیری :
18.15 MiB
اندازه مجموعه داده :
54.36 MiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 195،502 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'mt': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'mt')
مثالها ( tfds.as_dataframe ):
para_crawl / ennl
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به nl.
حجم دانلود :
400.63 MiB
اندازه مجموعه داده :
1.40 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 5،659،268 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'nl': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'nl')
مثالها ( tfds.as_dataframe ):
para_crawl / enpl
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به pl.
اندازه
257.90 MiB
:257.90 MiB
اندازه مجموعه داده :
885.63 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 3،503،276 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'pl': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'pl')
مثالها ( tfds.as_dataframe ):
para_crawl / enpt
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به pt.
اندازه
608.62 MiB
:608.62 MiB
اندازه مجموعه داده :
2.05 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 8،141،940 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'pt')
مثالها ( tfds.as_dataframe ):
para_crawl / enro
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به ro.
حجم دانلود :
153.24 MiB
اندازه مجموعه داده :
534.34 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 1،952،043 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ro': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'ro')
مثالها ( tfds.as_dataframe ):
para_crawl / ensk
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به sk.
حجم بارگیری :
96.61 MiB
اندازه مجموعه داده :
352.91 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 1،591،831 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'sk': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'sk')
مثالها ( tfds.as_dataframe ):
para_crawl / ensl
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به sl.
حجم دانلود :
62.02 MiB
اندازه مجموعه داده :
187.66 MiB
ذخیره خودکار ( مستندات ): فقط وقتی
shuffle_files=False
(قطار)تقسیم :
شکاف | مثال ها |
---|---|
'train' | 660،161 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'sl': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'sl')
مثالها ( tfds.as_dataframe ):
para_crawl / ensv
شرح پیکربندی : مجموعه داده ترجمه از انگلیسی به sv.
حجم دانلود :
262.76 MiB
اندازه مجموعه داده :
905.72 MiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 3،476،729 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'sv': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('en', 'sv')
مثالها ( tfds.as_dataframe ):