- توضیحات :
مجموعه استنتاج زبان طبیعی چند ژانر (MultiNLI) مجموعه ای متشکل از جمعیت 433 هزار جفت جمله است که با حاشیه اطلاعات متنی حاوی حاشیه است. این مجموعه از مجموعه SNLI الگوبرداری شده است ، اما تفاوت آن در این است که طیف وسیعی از ژانرهای متن گفتاری و نوشتاری را پوشش می دهد و از ارزیابی متمایز تعمیم ژانر پشتیبانی می کند. این مجموعه به عنوان پایه ای برای وظیفه مشترک کارگاه آموزشی RepEval 2017 در EMNLP در کپنهاگ عمل کرد.
صفحه اصلی : https://www.nyu.edu/projects/bowman/multinli/
کد منبع :
tfds.text.MultiNLI
نسخه ها :
-
1.1.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
216.34 MiB
اندازه مجموعه داده :
89.50 MiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 392702 |
'validation_matched' | 9،815 |
'validation_mismatched' | 9،832 |
- ویژگی ها :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'premise': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
نقل قول :
@InProceedings{N18-1101,
author = "Williams, Adina
and Nangia, Nikita
and Bowman, Samuel",
title = "A Broad-Coverage Challenge Corpus for
Sentence Understanding through Inference",
booktitle = "Proceedings of the 2018 Conference of
the North American Chapter of the
Association for Computational Linguistics:
Human Language Technologies, Volume 1 (Long
Papers)",
year = "2018",
publisher = "Association for Computational Linguistics",
pages = "1112--1122",
location = "New Orleans, Louisiana",
url = "http://aclweb.org/anthology/N18-1101"
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):