mlqa

תיאור :

MLQA (Multilingual Question Answering Dataset) הוא מערך נתונים בהשוואה להערכת ביצועי מענה לשאלות רב-לשוניות. מערך הנתונים מורכב מ-7 שפות: ערבית, גרמנית, ספרדית, אנגלית, הינדית, וייטנאמית, סינית.

תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/facebookresearch/MLQA
קוד מקור : tfds.datasets.mlqa.Builder
גרסאות :
- 1.0.0 (ברירת מחדל): אין הערות שחרור.
גודל הורדה : 72.21 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
מבנה תכונה :

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

תיעוד תכונה :

תכונה	מעמד	Dtype
	FeaturesDict
תשובות	סדר פעולות
answers/answer_start	מוֹתֵחַ	int32
תשובות/טקסט	טֶקסט	חוּט
הֶקשֵׁר	טֶקסט	חוּט
תְעוּדַת זֶהוּת	מוֹתֵחַ	חוּט
שְׁאֵלָה	טֶקסט	חוּט
כותרת	טֶקסט	חוּט

מפתחות בפיקוח (ראה as_supervised doc ): None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :

@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (תצורת ברירת המחדל)

תיאור תצורה : MLQA 'ar' dev and test splits.
גודל מערך נתונים : 9.28 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'test'`	5,335
`'validation'`	517

דוגמאות ( tfds.as_dataframe ):

mlqa/de

תיאור תצורה : MLQA 'de' dev and test splits.
גודל מערך נתונים : 5.06 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'test'`	4,517
`'validation'`	512

דוגמאות ( tfds.as_dataframe ):

mlqa/en

תיאור תצורה : MLQA 'en' dev and test splits.
גודל ערכת נתונים : 15.72 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'test'`	11,590
`'validation'`	1,148

דוגמאות ( tfds.as_dataframe ):

mlqa/es

תיאור תצורה : MLQA 'es' dev and test splits.
גודל מערך נתונים : 5.09 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'test'`	5,253
`'validation'`	500

דוגמאות ( tfds.as_dataframe ):

mlqa/hi

תיאור תצורה : MLQA 'hi' dev and test splits.
גודל ערכת נתונים: 12.83 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'test'`	4,918
`'validation'`	507

דוגמאות ( tfds.as_dataframe ):

mlqa/vi

תיאור תצורה : MLQA 'vi' dev and test splits.
גודל מערך נתונים : 8.77 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'test'`	5,495
`'validation'`	511

דוגמאות ( tfds.as_dataframe ):

mlqa/zh

תיאור תצורה : MLQA 'zh' dev and test splits.
גודל מערך נתונים : 5.13 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'test'`	5,137
`'validation'`	504

דוגמאות ( tfds.as_dataframe ):

mlqa קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

mlqa/ar (תצורת ברירת המחדל)

mlqa/de

mlqa/en

mlqa/es

mlqa/hi

mlqa/vi

mlqa/zh

mlqa