- תיאור :
XNLI היא תת-קבוצה של כמה אלפי דוגמאות מ-MNLI שתורגמה ל-14 שפות שונות (משאב נמוך כלשהו). כמו ב-MNLI, המטרה היא לחזות נגיעה טקסטואלית (האם משפט א' מרמז/סותר/לא משפט ב') והיא משימת סיווג (בהינתן שני משפטים, מנבא אחת משלוש תוויות).
תיעוד נוסף : חקור על ניירות עם קוד
קוד מקור :
tfds.text.Xnli
גרסאות :
-
1.1.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
17.04 MiB
גודל ערכת נתונים:
29.62 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 5,010 |
'validation' | 2,490 |
- מבנה תכונה :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
הַשׁעָרָה | TranslationVariableLanguages | |||
השערה/שפה | טֶקסט | חוּט | ||
השערה/תרגום | טֶקסט | חוּט | ||
תווית | ClassLabel | int64 | ||
הַנָחַת יְסוֹד | תִרגוּם | |||
הנחת יסוד/אר | טֶקסט | חוּט | ||
הנחת יסוד/בג | טֶקסט | חוּט | ||
premise/de | טֶקסט | חוּט | ||
הנחת יסוד/אל | טֶקסט | חוּט | ||
premise/he | טֶקסט | חוּט | ||
הנחת יסוד | טֶקסט | חוּט | ||
premise/fr | טֶקסט | חוּט | ||
הנחת יסוד/היי | טֶקסט | חוּט | ||
premise/ru | טֶקסט | חוּט | ||
הנחת יסוד / sw | טֶקסט | חוּט | ||
הנחת יסוד/ה | טֶקסט | חוּט | ||
הנחת יסוד/טר | טֶקסט | חוּט | ||
הנחת יסוד/ur | טֶקסט | חוּט | ||
הנחת יסוד/vi | טֶקסט | חוּט | ||
premise/zh | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@InProceedings{conneau2018xnli,
author = "Conneau, Alexis
and Rinott, Ruty
and Lample, Guillaume
and Williams, Adina
and Bowman, Samuel R.
and Schwenk, Holger
and Stoyanov, Veselin",
title = "XNLI: Evaluating Cross-lingual Sentence Representations",
booktitle = "Proceedings of the 2018 Conference on Empirical Methods
in Natural Language Processing",
year = "2018",
publisher = "Association for Computational Linguistics",
location = "Brussels, Belgium",
}
, - תיאור :
XNLI היא תת-קבוצה של כמה אלפי דוגמאות מ-MNLI שתורגמה ל-14 שפות שונות (משאב נמוך כלשהו). כמו ב-MNLI, המטרה היא לחזות נגיעה טקסטואלית (האם משפט א' מרמז/סותר/לא משפט ב') והיא משימת סיווג (בהינתן שני משפטים, מנבא אחת משלוש תוויות).
תיעוד נוסף : חקור על ניירות עם קוד
קוד מקור :
tfds.text.Xnli
גרסאות :
-
1.1.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
17.04 MiB
גודל ערכת נתונים:
29.62 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 5,010 |
'validation' | 2,490 |
- מבנה תכונה :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
הַשׁעָרָה | TranslationVariableLanguages | |||
השערה/שפה | טֶקסט | חוּט | ||
השערה/תרגום | טֶקסט | חוּט | ||
תווית | ClassLabel | int64 | ||
הַנָחַת יְסוֹד | תִרגוּם | |||
הנחת יסוד/אר | טֶקסט | חוּט | ||
הנחת יסוד/בג | טֶקסט | חוּט | ||
premise/de | טֶקסט | חוּט | ||
הנחת יסוד/אל | טֶקסט | חוּט | ||
premise/he | טֶקסט | חוּט | ||
הנחת יסוד | טֶקסט | חוּט | ||
premise/fr | טֶקסט | חוּט | ||
הנחת יסוד/היי | טֶקסט | חוּט | ||
premise/ru | טֶקסט | חוּט | ||
הנחת יסוד / sw | טֶקסט | חוּט | ||
הנחת יסוד/ה | טֶקסט | חוּט | ||
הנחת יסוד/טר | טֶקסט | חוּט | ||
הנחת יסוד/ur | טֶקסט | חוּט | ||
הנחת יסוד/vi | טֶקסט | חוּט | ||
premise/zh | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@InProceedings{conneau2018xnli,
author = "Conneau, Alexis
and Rinott, Ruty
and Lample, Guillaume
and Williams, Adina
and Bowman, Samuel R.
and Schwenk, Holger
and Stoyanov, Veselin",
title = "XNLI: Evaluating Cross-lingual Sentence Representations",
booktitle = "Proceedings of the 2018 Conference on Empirical Methods
in Natural Language Processing",
year = "2018",
publisher = "Association for Computational Linguistics",
location = "Brussels, Belgium",
}