Эта страница была переведа с помощью Cloud Translation API.
Switch to English

Clinc_oos

  • Описание :

Диалоговые системы, ориентированные на задачи, должны знать, когда запрос выходит за пределы диапазона поддерживаемых намерений, но текущие корпуса классификации текста определяют только наборы меток, охватывающие каждый пример. Мы представляем новый набор данных, который включает запросы, выходящие за рамки (OOS), т. Е. Запросы, которые не попадают ни в одно из поддерживаемых системой намерений. Это создает новую проблему, поскольку модели не могут предполагать, что каждый запрос во время вывода принадлежит классу намерений, поддерживаемому системой. Наш набор данных также охватывает 150 классов намерений в 10 доменах, охватывая всю широту, с которой должен справиться агент, ориентированный на рабочие задачи. Он предлагает способ более строгого и реалистичного тестирования классификации текста в диалоговых системах, управляемых задачами.

  • Домашняя страница : https://github.com/clinc/oos-eval/

  • Исходный код : tfds.text.ClincOOS

  • Версии :

    • 0.1.0 (по умолчанию): без примечаний к выпуску.
  • Размер загрузки : 256.01 KiB

  • Размер набора данных : 3.40 MiB

  • Автоматическое кэширование ( документация ): Да

  • Сплит :

Трещина Примеры
'test' 4,500
'test_oos' 1,000
'train' 15 000
'train_oos' 100
'validation' 3 000
'validation_oos' 100
  • Особенности :
FeaturesDict({
    'domain': tf.int32,
    'domain_name': Text(shape=(), dtype=tf.string),
    'intent': tf.int32,
    'intent_name': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
})
  • Контролируемые ключи (см. as_supervised doc ): ('text', 'intent')

  • Цитата :

@inproceedings{larson-etal-2019-evaluation,
    title = "An Evaluation Dataset for Intent Classification and Out-of-Scope Prediction",
    author = "Larson, Stefan  and
      Mahendran, Anish  and
      Peper, Joseph J.  and
      Clarke, Christopher  and
      Lee, Andrew  and
      Hill, Parker  and
      Kummerfeld, Jonathan K.  and
      Leach, Kevin  and
      Laurenzano, Michael A.  and
      Tang, Lingjia  and
      Mars, Jason",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/D19-1131",
    doi = "10.18653/v1/D19-1131",
    pages = "1311--1316",
}