Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

multi_nli

  • Descripción:

El corpus Multi-Genre Natural Language Inference (MultiNLI) es una colección de fuentes múltiples de 433k pares de oraciones anotadas con información de vinculación textual. El corpus se basa en el corpus del SNLI, pero difiere en que cubre una variedad de géneros de texto hablado y escrito, y apoya una evaluación distintiva de generalización entre géneros. El corpus sirvió como base para la tarea compartida del Taller RepEval 2017 en EMNLP en Copenhague.

Separar Ejemplos de
'train' 392,702
'validation_matched' 9,815
'validation_mismatched' 9,832
  • características:
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'premise': Text(shape=(), dtype=tf.string),
})
  • Cita:
@InProceedings{N18-1101,
  author = "Williams, Adina
            and Nangia, Nikita
            and Bowman, Samuel",
  title = "A Broad-Coverage Challenge Corpus for
           Sentence Understanding through Inference",
  booktitle = "Proceedings of the 2018 Conference of
               the North American Chapter of the
               Association for Computational Linguistics:
               Human Language Technologies, Volume 1 (Long
               Papers)",
  year = "2018",
  publisher = "Association for Computational Linguistics",
  pages = "1112--1122",
  location = "New Orleans, Louisiana",
  url = "http://aclweb.org/anthology/N18-1101"
}