Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

doc_nli

  • Описание:

DocNLI - это крупномасштабный набор данных для вывода естественного языка на уровне документа (NLI). DocNLI преобразован из широкого спектра задач НЛП и охватывает множество жанров текста. Предпосылки всегда остаются в гранулярности документа, тогда как гипотезы различаются по длине от отдельных предложений до отрывков из сотен слов. В отличие от некоторых существующих наборов данных NLI на уровне предложений, DocNLI имеет довольно ограниченные артефакты.

Расколоть Примеры
'test' 267 086
'train' 942 314
'validation' 234 258
  • Особенности:
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'premise': Text(shape=(), dtype=tf.string),
})
  • Образец цитирования:
@inproceedings{yin-etal-2021-docnli,
    title={DocNLI: A Large-scale Dataset for Document-level Natural Language Inference},
    author={Wenpeng Yin and Dragomir Radev and Caiming Xiong},
    booktitle = "Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021",
    month = aug,
    year = "2021",
    address = "Bangkok, Thailand",
    publisher = "Association for Computational Linguistics",
}