امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

wmt19_translate

  • توضیحات :

مجموعه داده را بر اساس داده های statmt.org ترجمه کنید.

نسخه ها برای سالهای مختلف با استفاده از ترکیبی از چندین منبع داده وجود دارد. wmt_translate پایه به شما این امکان را می دهد که با ایجاد یک tfds.translate.wmt.WmtConfig سفارشی پیکربندی خود را برای انتخاب جفت داده / زبان خود ایجاد کنید.

config = tfds.translate.wmt.WmtConfig(
    version="0.0.1",
    language_pair=("fr", "de"),
    subsets={
        tfds.Split.TRAIN: ["commoncrawl_frde"],
        tfds.Split.VALIDATION: ["euelections_dev2019"],
    },
)
builder = tfds.builder("wmt_translate", config=config)
  • صفحه اصلی : http://www.statmt.org/wmt19/translation-task.html

  • کد منبع :tfds.translate.Wmt19Translate

  • نسخه ها :

    • 1.0.0 (پیش فرض): بدون یادداشت انتشار.
  • اندازه مجموعه داده : Unknown size

  • دستورالعمل های بارگیری دستی : برای این مجموعه داده لازم است که داده های منبع را به صورت دستی در download_config.manual_dir (به طور پیش فرض ~/tensorflow_datasets/downloads/manual/ ):
    برخی از تنظیمات wmt در اینجا ، نیاز به بارگیری دستی دارند. لطفاً به wmt.py مراجعه کنید تا مسیر دقیق (و نام پرونده) را که باید بارگیری شود ، ببینید.

  • ذخیره خودکار ( مستندات ): ناشناخته است

  • نقل قول :

@ONLINE {wmt19translate,
    author = "Wikimedia Foundation",
    title  = "ACL 2019 Fourth Conference on Machine Translation (WMT19), Shared Task: Machine Translation of News",
    url    = "http://www.statmt.org/wmt19/translation-task.html"
}

wmt19_translate / cs-en (پیکربندی پیش فرض)

  • شرح پیکربندی : مجموعه داده های کار ترجمه WMT 2019 cs-en.

  • حجم دانلود : 1.88 GiB

  • تقسیم :

شکاف مثال ها
'train' 20،246،548
'validation' 2،983
  • ویژگی ها :
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt19_translate / de-en

  • توضیحات پیکربندی : مجموعه داده های کار ترجمه de-en WMT 2019.

  • اندازه بارگیری : 9.71 GiB

  • تقسیم :

شکاف مثال ها
'train' 38،690،334
'validation' 2،998
  • ویژگی ها :
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt19_translate / fi-en

  • شرح پیکربندی : مجموعه داده های کار ترجمه WMT 2019 fi-en.

  • اندازه 959.46 MiB : 959.46 MiB

  • تقسیم :

شکاف مثال ها
'train' 6،587،448
'validation' 3000
  • ویژگی ها :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

wmt19_translate / gu-en

  • شرح پیکربندی : مجموعه داده کار ترجمه WMT 2019 gu-en.

  • حجم بارگیری : 37.03 MiB

  • تقسیم :

شکاف مثال ها
'train' 11،670
'validation' 1،998
  • ویژگی ها :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'gu': Text(shape=(), dtype=tf.string),
})

wmt19_translate / kk-en

  • شرح پیکربندی : مجموعه داده کار WMT 2019 kk-en ترجمه.

  • اندازه بارگیری : 39.58 MiB

  • تقسیم :

شکاف مثال ها
'train' 126،583
'validation' 2066
  • ویژگی ها :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'kk': Text(shape=(), dtype=tf.string),
})

wmt19_translate / lt-en

  • شرح پیکربندی : WMT 2019 مجموعه داده های کار ترجمه lt-en.

  • اندازه 392.20 MiB : 392.20 MiB

  • تقسیم :

شکاف مثال ها
'train' 2،344،893
'validation' 2000
  • ویژگی ها :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lt': Text(shape=(), dtype=tf.string),
})

wmt19_translate / ru-en

  • شرح پیکربندی : مجموعه داده کار ترجمه WMT 2019 ru-en.

  • اندازه بارگیری : 3.86 GiB

  • تقسیم :

شکاف مثال ها
'train' 38،492،126
'validation' 3000
  • ویژگی ها :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

wmt19_translate / zh-en

  • شرح پیکربندی : مجموعه داده های کار ترجمه WMT 2019 zh-en.

  • اندازه بارگیری : 2.04 GiB

  • تقسیم :

شکاف مثال ها
'train' 25،986،436
'validation' 3،981
  • ویژگی ها :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'zh': Text(shape=(), dtype=tf.string),
})

wmt19_translate / fr-de

  • شرح پیکربندی : مجموعه داده کار ترجمه WMT 2019 fr-de.

  • اندازه 722.20 MiB : 722.20 MiB

  • تقسیم :

شکاف مثال ها
'train' 9،824،476
'validation' 1،512
  • ویژگی ها :
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'fr': Text(shape=(), dtype=tf.string),
})