امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

paws_x_wiki

  • توضیحات :

این مجموعه داده شامل 23659 جفت ارزیابی PAWS ترجمه شده توسط انسان و 296406 جفت آموزش ترجمه شده ماشینی به شش زبان متمایز از نظر تیپولوژیکی است:

  • فرانسوی
  • اسپانیایی
  • آلمانی
  • چینی ها
  • ژاپنی
  • کره ای

برای جزئیات بیشتر ، به مقاله همراه مراجعه کنید: PAWS-X: یک مجموعه داده خصمانه متقابل زبانی برای شناسایی پارافره در https://arxiv.org/abs/1908.11828

مشابه مجموعه داده PAWS ، مثالها به بخشهای Train / Dev / Test تقسیم می شوند. همه پرونده ها در قالب tsv با چهار ستون هستند:

id یک شناسه منحصر به فرد برای هر جمله جفت 1 جمله جمله اول 2 برچسب جمله دوم (noisy_) برچسب (Noisy) برای هر جفت

هر برچسب دارای دو مقدار ممکن است: 0 نشانگر معنای متفاوت این جفت است ، در حالی که 1 نشان می دهد جفت یک عبارت است.

FeaturesDict({
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'sentence1': Text(shape=(), dtype=tf.string),
    'sentence2': Text(shape=(), dtype=tf.string),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): None

  • نقل قول :

@InProceedings{pawsx2019emnlp,
  title = { {PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification} },
  author = {Yang, Yinfei and Zhang, Yuan and Tar, Chris and Baldridge, Jason},
  booktitle = {Proc. of EMNLP},
  year = {2019}
}

paws_x_wiki / de (پیکربندی پیش فرض)

  • شرح پیکربندی : ترجمه شده به de

  • اندازه مجموعه داده : 15.27 MiB

  • تقسیم :

شکاف مثال ها
'test' 2000
'train' 49،380
'validation' 2000

paws_x_wiki / en

  • شرح پیکربندی : به en ترجمه شده است

  • اندازه مجموعه داده : 14.59 MiB

  • تقسیم :

شکاف مثال ها
'test' 2000
'train' 49،175
'validation' 2000

paws_x_wiki / es

  • شرح پیکربندی : ترجمه شده به es

  • اندازه مجموعه داده : 15.27 MiB

  • تقسیم :

شکاف مثال ها
'test' 2000
'train' 49،401
'validation' 1،961

paws_x_wiki / fr

  • شرح پیکربندی : به fr ترجمه شده است

  • اندازه مجموعه داده : 15.79 MiB

  • تقسیم :

شکاف مثال ها
'test' 2000
'train' 49399
'validation' 1،988

paws_x_wiki / ja

  • شرح پیکربندی : ترجمه شده به ja

  • اندازه مجموعه داده : 17.77 MiB

  • تقسیم :

شکاف مثال ها
'test' 2000
'train' 49،401
'validation' 2000

paws_x_wiki / ko

  • شرح پیکربندی : ترجمه شده به ko

  • اندازه مجموعه داده : 16.42 MiB

  • تقسیم :

شکاف مثال ها
'test' 1،999
'train' 49،164
'validation' 2000

paws_x_wiki / zh

  • شرح پیکربندی : به zh ترجمه شده است

  • اندازه مجموعه داده : 13.20 MiB

  • تقسیم :

شکاف مثال ها
'test' 2000
'train' 49،401
'validation' 2000