- توضیحات :
مجموعه داده های حاصل از متن گفتگوی TED برای مقایسه جفت های زبانی مشابه که در آن یکی منبع بالا و دیگری منبع کم است.
صفحه اصلی : https://github.com/neulab/word-embeddings-for-nmt
کد منبع :
tfds.translate.TedHrlrTranslate
نسخه ها :
-
1.0.0
(پیش فرض): API جدید تقسیم شده ( https://tensorflow.org/datasets/splits )
-
حجم
124.94 MiB
:124.94 MiB
اندازه مجموعه داده :
Unknown size
ذخیره خودکار ( مستندات ): ناشناخته است
نقل قول :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
- شکل ( tfds.show_examples ): پشتیبانی نمی شود.
ted_hrlr_translate / az_to_en (پیکربندی پیش فرض)
شرح پیکربندی : مجموعه داده ترجمه از az به en در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 903 |
'train' | 5،946 |
'validation' | 671 |
- ویژگی ها :
Translation({
'az': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('az', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / aztr_to_en
شرح پیکربندی : مجموعه داده ترجمه شده از az_tr به en در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 903 |
'train' | 188.396 |
'validation' | 671 |
- ویژگی ها :
Translation({
'az_tr': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('az_tr', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / be_en_en
توضیحات پیکربندی : مجموعه داده ترجمه از be to en در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 664 |
'train' | 4،509 |
'validation' | 248 |
- ویژگی ها :
Translation({
'be': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('be', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / beru_en_en
شرح پیکربندی : مجموعه داده ترجمه از be_ru به en در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 664 |
'train' | 212،614 |
'validation' | 248 |
- ویژگی ها :
Translation({
'be_ru': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('be_ru', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / es_to_pt
توضیحات پیکربندی : مجموعه داده ترجمه شده از es به pt در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 1،763 |
'train' | 44938 |
'validation' | 1016 |
- ویژگی ها :
Translation({
'es': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('es', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / fr_to_pt
شرح پیکربندی : مجموعه داده ترجمه شده از fr به pt در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 1494 |
'train' | 43،873 |
'validation' | 1،131 |
- ویژگی ها :
Translation({
'fr': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('fr', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / gl_to_en
شرح پیکربندی : مجموعه داده ترجمه شده از gl به en در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 1،007 |
'train' | 10،017 |
'validation' | 682 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'gl': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('gl', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / glpt_to_en
شرح پیکربندی : مجموعه داده ترجمه شده از gl_pt به en در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 1،007 |
'train' | 61802 |
'validation' | 682 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'gl_pt': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('gl_pt', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / he_to_pt
شرح پیکربندی : مجموعه داده ترجمه شده از او به pt در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 1،623 |
'train' | 48511 |
'validation' | 1،145 |
- ویژگی ها :
Translation({
'he': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('he', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / it_to_pt
شرح پیکربندی : مجموعه داده ترجمه شده از آن به pt در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 1،669 |
'train' | 46،259 |
'validation' | 1،162 |
- ویژگی ها :
Translation({
'it': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('it', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / pt_to_en
توضیحات پیکربندی : مجموعه داده ترجمه شده از pt به en در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 1،803 |
'train' | 51،785 |
'validation' | 1،193 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('pt', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / ru_to_en
شرح پیکربندی : مجموعه داده ترجمه از ru به en در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 5476 |
'train' | 208،106 |
'validation' | 4805 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ru': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('ru', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / ru_to_pt
شرح پیکربندی : مجموعه داده ترجمه از ru به pt در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 1،588 |
'train' | 47،278 |
'validation' | 1،184 |
- ویژگی ها :
Translation({
'pt': Text(shape=(), dtype=tf.string),
'ru': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('ru', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate / tr_to_en
شرح پیکربندی : مجموعه داده ترجمه شده از tr به en در متن ساده.
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 5،029 |
'train' | 182،450 |
'validation' | 4،045 |
- ویژگی ها :
Translation({
'en': Text(shape=(), dtype=tf.string),
'tr': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('tr', 'en')
مثالها ( tfds.as_dataframe ):