- توضیحات :
این مجموعه داده شامل ترجمه های ماشینی MNLI به هر یک از زبان های XNLI است. داده های ترجمه توسط XTREME ارائه شده است. توجه داشته باشید که این با داده های ترجمه شده ماشینی ارائه شده توسط مقاله اصلی XNLI متفاوت است.
صفحه اصلی : https://www.nyu.edu/projects/bowman/xnli/
کد منبع :
tfds.text.xtreme_xnli.XtremeXnli
نسخه ها :
-
1.1.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
2.31 GiB
اندازه مجموعه داده :
1.59 GiB
ذخیره خودکار ( مستندات ): خیر
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 392،570 |
- ویژگی ها :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=tf.string),
'translation': Text(shape=(), dtype=tf.string),
}),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=tf.string),
'bg': Text(shape=(), dtype=tf.string),
'de': Text(shape=(), dtype=tf.string),
'el': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
'es': Text(shape=(), dtype=tf.string),
'fr': Text(shape=(), dtype=tf.string),
'hi': Text(shape=(), dtype=tf.string),
'ru': Text(shape=(), dtype=tf.string),
'sw': Text(shape=(), dtype=tf.string),
'th': Text(shape=(), dtype=tf.string),
'tr': Text(shape=(), dtype=tf.string),
'ur': Text(shape=(), dtype=tf.string),
'vi': Text(shape=(), dtype=tf.string),
'zh': Text(shape=(), dtype=tf.string),
}),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
نقل قول :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):