ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

wmt17_translate

  • รายละเอียด:

แปลชุดข้อมูลตามข้อมูลจาก statmt.org

มีเวอร์ชันสำหรับปีต่างๆ โดยใช้แหล่งข้อมูลหลายแหล่งรวมกัน ฐาน wmt_translate ช่วยให้คุณสร้างปรับแต่งของคุณเองที่จะเลือกคู่ข้อมูล / ภาษาของคุณเองโดยการสร้างที่กำหนดเอง tfds.translate.wmt.WmtConfig

config = tfds.translate.wmt.WmtConfig(
    version="0.0.1",
    language_pair=("fr", "de"),
    subsets={
        tfds.Split.TRAIN: ["commoncrawl_frde"],
        tfds.Split.VALIDATION: ["euelections_dev2019"],
    },
)
builder = tfds.builder("wmt_translate", config=config)
  • โฮมเพจ: http://www.statmt.org/wmt17/translation-task.html

  • รหัสที่มา: tfds.translate.Wmt17Translate

  • รุ่น:

    • 1.0.0 (เริ่มต้น): ไม่มีบันทึกประจำรุ่น
  • ขนาดชุด: Unknown size

  • คำแนะนำการดาวน์โหลดคู่มือ: ชุดนี้คุณจะต้องดาวน์โหลดข้อมูลแหล่งที่มาของตนเองลงใน download_config.manual_dir (ค่าเริ่มต้น ~/tensorflow_datasets/downloads/manual/ ):
    การกำหนดค่า wmt บางส่วนที่นี่ ต้องดาวน์โหลดด้วยตนเอง โปรดดูที่ wmt.py เพื่อดูเส้นทางที่แน่นอน (และชื่อไฟล์) ที่ต้องดาวน์โหลด

  • ออโต้แคช ( เอกสาร ): ไม่ทราบ

  • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

  • อ้างอิง:

@InProceedings{bojar-EtAl:2017:WMT1,
  author    = {Bojar, Ond
{r}ej  and  Chatterjee, Rajen  and  Federmann, Christian  and  Graham, Yvette  and  Haddow, Barry  and  Huang, Shujian  and  Huck, Matthias  and  Koehn, Philipp  and  Liu, Qun  and  Logacheva, Varvara  and  Monz, Christof  and  Negri, Matteo  and  Post, Matt  and  Rubino, Raphael  and  Specia, Lucia  and  Turchi, Marco},
  title     = {Findings of the 2017 Conference on Machine Translation (WMT17)},
  booktitle = {Proceedings of the Second Conference on Machine Translation, Volume 2: Shared Task Papers},
  month     = {September},
  year      = {2017},
  address   = {Copenhagen, Denmark},
  publisher = {Association for Computational Linguistics},
  pages     = {169--214},
  url       = {http://www.aclweb.org/anthology/W17-4717}
}

wmt17_translate/cs-en (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย Config: WMT 2017 cs-en ชุดงานแปล

  • ขนาดการดาวน์โหลด: 1.66 GiB

  • แยก:

แยก ตัวอย่าง
'test' 3,005
'train' 15,851,649
'validation' 2,999
  • คุณสมบัติ:
Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt17_translate/de-en

  • คำอธิบาย Config: WMT 2017 de-en ชุดงานแปล

  • ขนาดการดาวน์โหลด: 1.81 GiB

  • แยก:

แยก ตัวอย่าง
'test' 3,004
'train' 5,906,184
'validation' 2,999
  • คุณสมบัติ:
Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt17_translate/fi-en

  • คำอธิบาย Config: WMT 2017 FI-en ชุดงานแปล

  • ขนาดการดาวน์โหลด: 414.10 MiB

  • แยก:

แยก ตัวอย่าง
'test' 6,004
'train' 2,656,542
'validation' 6,000
  • คุณสมบัติ:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

wmt17_translate/lv-th

  • คำอธิบาย Config: WMT 2017 LV-en ชุดงานแปล

  • ขนาดการดาวน์โหลด: 161.69 MiB

  • แยก:

แยก ตัวอย่าง
'test' 2,001
'train' 3,567,528
'validation' 2,003
  • คุณสมบัติ:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'lv': Text(shape=(), dtype=tf.string),
})

wmt17_translate/ru-en

  • คำอธิบาย Config: WMT 2017 RU-en ชุดงานแปล

  • ขนาดการดาวน์โหลด: 3.34 GiB

  • แยก:

แยก ตัวอย่าง
'test' 3,001
'train' 25,782,720
'validation' 2,998
  • คุณสมบัติ:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

wmt17_translate/tr-th

  • คำอธิบาย Config: WMT 2017 tr-en ชุดงานแปล

  • ขนาดการดาวน์โหลด: 59.32 MiB

  • แยก:

แยก ตัวอย่าง
'test' 3,007
'train' 205,756
'validation' 3,000
  • คุณสมบัติ:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'tr': Text(shape=(), dtype=tf.string),
})

wmt17_translate/zh-en

  • คำอธิบาย Config: WMT 2017 zh-en ชุดงานแปล

  • ขนาดการดาวน์โหลด: 2.16 GiB

  • แยก:

แยก ตัวอย่าง
'test' 2,001
'train' 25,136,609
'validation' 2,002
  • คุณสมบัติ:
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'zh': Text(shape=(), dtype=tf.string),
})