امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

wmt19_translate

 • توضیحات :

مجموعه داده را بر اساس داده های statmt.org ترجمه کنید.

نسخه ها برای سالهای مختلف با استفاده از ترکیبی از چندین منبع داده وجود دارد. wmt_translate پایه به شما این امکان را می دهد که با ایجاد یک tfds.translate.wmt.WmtConfig سفارشی پیکربندی خود را برای انتخاب جفت داده / زبان خود ایجاد کنید.

config = tfds.translate.wmt.WmtConfig(
  version="0.0.1",
  language_pair=("fr", "de"),
  subsets={
    tfds.Split.TRAIN: ["commoncrawl_frde"],
    tfds.Split.VALIDATION: ["euelections_dev2019"],
  },
)
builder = tfds.builder("wmt_translate", config=config)
 • صفحه اصلی : http://www.statmt.org/wmt19/translation-task.html

 • کد منبع :tfds.translate.Wmt19Translate

 • نسخه ها :

  • 1.0.0 (پیش فرض): بدون یادداشت انتشار.
 • اندازه مجموعه داده : Unknown size

 • دستورالعمل های بارگیری دستی : برای این مجموعه داده لازم است که داده های منبع را به صورت دستی در download_config.manual_dir (به طور پیش فرض ~/tensorflow_datasets/downloads/manual/ ):
  برخی از تنظیمات wmt در اینجا ، نیاز به بارگیری دستی دارند. لطفاً به wmt.py مراجعه کنید تا مسیر دقیق (و نام پرونده) را که باید بارگیری شود ، ببینید.

 • ذخیره خودکار ( مستندات ): ناشناخته است

 • نقل قول :

@ONLINE {wmt19translate,
  author = "Wikimedia Foundation",
  title = "ACL 2019 Fourth Conference on Machine Translation (WMT19), Shared Task: Machine Translation of News",
  url  = "http://www.statmt.org/wmt19/translation-task.html"
}

wmt19_translate / cs-en (پیکربندی پیش فرض)

 • شرح پیکربندی : مجموعه داده های کار ترجمه WMT 2019 cs-en.

 • حجم دانلود : 1.88 GiB

 • تقسیم :

شکاف مثال ها
'train' 20،246،548
'validation' 2،983
 • ویژگی ها :
Translation({
  'cs': Text(shape=(), dtype=tf.string),
  'en': Text(shape=(), dtype=tf.string),
})

wmt19_translate / de-en

 • توضیحات پیکربندی : مجموعه داده های کار ترجمه de-en WMT 2019.

 • اندازه بارگیری : 9.71 GiB

 • تقسیم :

شکاف مثال ها
'train' 38،690،334
'validation' 2،998
 • ویژگی ها :
Translation({
  'de': Text(shape=(), dtype=tf.string),
  'en': Text(shape=(), dtype=tf.string),
})

wmt19_translate / fi-en

 • شرح پیکربندی : مجموعه داده های کار ترجمه WMT 2019 fi-en.

 • اندازه 959.46 MiB : 959.46 MiB

 • تقسیم :

شکاف مثال ها
'train' 6،587،448
'validation' 3000
 • ویژگی ها :
Translation({
  'en': Text(shape=(), dtype=tf.string),
  'fi': Text(shape=(), dtype=tf.string),
})

wmt19_translate / gu-en

 • شرح پیکربندی : مجموعه داده کار ترجمه WMT 2019 gu-en.

 • حجم بارگیری : 37.03 MiB

 • تقسیم :

شکاف مثال ها
'train' 11،670
'validation' 1،998
 • ویژگی ها :
Translation({
  'en': Text(shape=(), dtype=tf.string),
  'gu': Text(shape=(), dtype=tf.string),
})

wmt19_translate / kk-en

 • شرح پیکربندی : مجموعه داده کار WMT 2019 kk-en ترجمه.

 • اندازه بارگیری : 39.58 MiB

 • تقسیم :

شکاف مثال ها
'train' 126،583
'validation' 2066
 • ویژگی ها :
Translation({
  'en': Text(shape=(), dtype=tf.string),
  'kk': Text(shape=(), dtype=tf.string),
})

wmt19_translate / lt-en

 • شرح پیکربندی : WMT 2019 مجموعه داده های کار ترجمه lt-en.

 • اندازه 392.20 MiB : 392.20 MiB

 • تقسیم :

شکاف مثال ها
'train' 2،344،893
'validation' 2000
 • ویژگی ها :
Translation({
  'en': Text(shape=(), dtype=tf.string),
  'lt': Text(shape=(), dtype=tf.string),
})

wmt19_translate / ru-en

 • شرح پیکربندی : مجموعه داده کار ترجمه WMT 2019 ru-en.

 • اندازه بارگیری : 3.86 GiB

 • تقسیم :

شکاف مثال ها
'train' 38،492،126
'validation' 3000
 • ویژگی ها :
Translation({
  'en': Text(shape=(), dtype=tf.string),
  'ru': Text(shape=(), dtype=tf.string),
})

wmt19_translate / zh-en

 • شرح پیکربندی : مجموعه داده های کار ترجمه WMT 2019 zh-en.

 • اندازه بارگیری : 2.04 GiB

 • تقسیم :

شکاف مثال ها
'train' 25،986،436
'validation' 3،981
 • ویژگی ها :
Translation({
  'en': Text(shape=(), dtype=tf.string),
  'zh': Text(shape=(), dtype=tf.string),
})

wmt19_translate / fr-de

 • شرح پیکربندی : مجموعه داده کار ترجمه WMT 2019 fr-de.

 • اندازه 722.20 MiB : 722.20 MiB

 • تقسیم :

شکاف مثال ها
'train' 9،824،476
'validation' 1،512
 • ویژگی ها :
Translation({
  'de': Text(shape=(), dtype=tf.string),
  'fr': Text(shape=(), dtype=tf.string),
})