xtreme_pawsx

  • תיאור:

מערך נתונים זה מכיל תרגומי מכונה של נתוני האימון PAWS באנגלית. התרגומים מסופקים על ידי מדד XTREME ומכסים את השפות הבאות:

  • צָרְפָתִית
  • ספרדית
  • גֶרמָנִיָת
  • סִינִית
  • יַפָּנִית
  • קוריאנית

לפרטים נוספים על כפות, לראות את ניירות: כפות: פרפרזה היריבה מ- Word ערבול ב https://arxiv.org/abs/1904.01130 ואת כפות-X: צלב-לשוני תשובה: בסיס נתון עבור זיהוי פרפרזה על https: // arXiv. org/abs/1908.11828

לפרטים הקשורים XTREME, עיין: XTREME: A ניתנת רב ריבוי משימות בנצ'מרק עבור הערכת הצלב לשוני הכללה על https://arxiv.org/abs/2003.11080

FeaturesDict({
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'sentence1': Text(shape=(), dtype=tf.string),
    'sentence2': Text(shape=(), dtype=tf.string),
})
@article{hu2020xtreme,
      author    = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
      title     = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
      journal   = {CoRR},
      volume    = {abs/2003.11080},
      year      = {2020},
      archivePrefix = {arXiv},
      eprint    = {2003.11080}
}

xtreme_pawsx/de (הגדרת ברירת מחדל)

  • תיאור Config: תורגם ל דה

  • גודל ההורדה: 22.34 MiB

  • מערך נתונים גודל: 14.19 MiB

  • פיצולים:

לְפַצֵל דוגמאות
'train' 49,340

xtreme_pawsx/es

  • תיאור Config: תורגם ל es

  • גודל ההורדה: 22.27 MiB

  • מערך נתונים גודל: 14.09 MiB

  • פיצולים:

לְפַצֵל דוגמאות
'train' 49,244

xtreme_pawsx/fr

  • תיאור Config: תורגם ל fr

  • גודל ההורדה: 22.70 MiB

  • מערך נתונים גודל: 14.53 MiB

  • פיצולים:

לְפַצֵל דוגמאות
'train' 49,208

xtreme_pawsx/ja

  • תיאור Config: תורגם ל ja

  • גודל ההורדה: 25.12 MiB

  • מערך נתונים גודל: 16.98 MiB

  • פיצולים:

לְפַצֵל דוגמאות
'train' 49,086

xtreme_pawsx/ko

  • תיאור Config: תורגם ל ko

  • גודל ההורדה: 22.99 MiB

  • מערך נתונים גודל: 14.86 MiB

  • פיצולים:

לְפַצֵל דוגמאות
'train' 49,298

xtreme_pawsx/zh

  • תיאור Config: תורגם ל zh

  • גודל ההורדה: 21.45 MiB

  • מערך נתונים גודל: 13.21 MiB

  • פיצולים:

לְפַצֵל דוגמאות
'train' 49,149