O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

doc_nli

  • Descrição:

DocNLI é um conjunto de dados em grande escala para inferência de linguagem natural em nível de documento (NLI). DocNLI é transformado de uma ampla gama de problemas de PNL e cobre vários gêneros de texto. As premissas sempre ficam na granularidade do documento, ao passo que as hipóteses variam em extensão de frases simples a trechos com centenas de palavras. Em contraste com alguns conjuntos de dados NLI de nível de frase existentes, DocNLI tem artefatos bastante limitados.

Dividir Exemplos
'test' 267.086
'train' 942.314
'validation' 234.258
  • Características:
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'premise': Text(shape=(), dtype=tf.string),
})
  • citação:
@inproceedings{yin-etal-2021-docnli,
    title={DocNLI: A Large-scale Dataset for Document-level Natural Language Inference},
    author={Wenpeng Yin and Dragomir Radev and Caiming Xiong},
    booktitle = "Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021",
    month = aug,
    year = "2021",
    address = "Bangkok, Thailand",
    publisher = "Association for Computational Linguistics",
}