- תיאור:
מערך נתונים זה מכיל תרגומי מכונה של נתוני האימון PAWS באנגלית. התרגומים מסופקים על ידי מדד XTREME ומכסים את השפות הבאות:
- צָרְפָתִית
- ספרדית
- גֶרמָנִיָת
- סִינִית
- יַפָּנִית
- קוריאנית
לפרטים נוספים על כפות, לראות את ניירות: כפות: פרפרזה היריבה מ- Word ערבול ב https://arxiv.org/abs/1904.01130 ואת כפות-X: צלב-לשוני תשובה: בסיס נתון עבור זיהוי פרפרזה על https: // arXiv. org/abs/1908.11828
לפרטים הקשורים XTREME, עיין: XTREME: A ניתנת רב ריבוי משימות בנצ'מרק עבור הערכת הצלב לשוני הכללה על https://arxiv.org/abs/2003.11080
קוד מקור:
tfds.text.xtreme_pawsx.XtremePawsx
גרסאות:
-
1.0.0
(ברירת המחדל): הערות השחרור לא.
-
Auto-במטמון ( תיעוד ): כן
מאפיינים:
FeaturesDict({
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'sentence1': Text(shape=(), dtype=tf.string),
'sentence2': Text(shape=(), dtype=tf.string),
})
מפתחות השגחה (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט:
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de (הגדרת ברירת מחדל)
תיאור Config: תורגם ל דה
גודל ההורדה:
22.34 MiB
מערך נתונים גודל:
14.19 MiB
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,340 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/es
תיאור Config: תורגם ל es
גודל ההורדה:
22.27 MiB
מערך נתונים גודל:
14.09 MiB
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,244 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/fr
תיאור Config: תורגם ל fr
גודל ההורדה:
22.70 MiB
מערך נתונים גודל:
14.53 MiB
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,208 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/ja
תיאור Config: תורגם ל ja
גודל ההורדה:
25.12 MiB
מערך נתונים גודל:
16.98 MiB
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,086 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/ko
תיאור Config: תורגם ל ko
גודל ההורדה:
22.99 MiB
מערך נתונים גודל:
14.86 MiB
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,298 |
- דוגמאות ( tfds.as_dataframe ):
xtreme_pawsx/zh
תיאור Config: תורגם ל zh
גודל ההורדה:
21.45 MiB
מערך נתונים גודל:
13.21 MiB
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'train' | 49,149 |
- דוגמאות ( tfds.as_dataframe ):