- Описание:
Корпус Multi-Genre Natural Language Inference (MultiNLI) представляет собой краудсорсинговую коллекцию из 433 тысяч пар предложений, аннотированных текстовой информацией. Корпус смоделирован на основе корпуса SNLI, но отличается тем, что охватывает ряд жанров устного и письменного текста и поддерживает отличительную оценку межжанрового обобщения. Корпус послужил основой для совместной задачи семинара RepEval 2017 в EMNLP в Копенгагене.
Домашняя страница: https://www.nyu.edu/projects/bowman/multinli/
Исходный код:
tfds.text.MultiNLI
Версии:
-
1.1.0
( по умолчанию): Нет Замечания к выпуску.
-
Скачать Размер:
216.34 MiB
Dataset Размер:
89.50 MiB
Авто-кэшируются ( документация ): Да
расколы:
Расколоть | Примеры |
---|---|
'train' | 392 702 |
'validation_matched' | 9 815 |
'validation_mismatched' | 9 832 |
- Особенности:
FeaturesDict({
'hypothesis': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'premise': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см
as_supervised
документ ):None
Рис ( tfds.show_examples ): Не поддерживается.
Примеры ( tfds.as_dataframe ):
- Образец цитирования:
@InProceedings{N18-1101,
author = "Williams, Adina
and Nangia, Nikita
and Bowman, Samuel",
title = "A Broad-Coverage Challenge Corpus for
Sentence Understanding through Inference",
booktitle = "Proceedings of the 2018 Conference of
the North American Chapter of the
Association for Computational Linguistics:
Human Language Technologies, Volume 1 (Long
Papers)",
year = "2018",
publisher = "Association for Computational Linguistics",
pages = "1112--1122",
location = "New Orleans, Louisiana",
url = "http://aclweb.org/anthology/N18-1101"
}