Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

schema_guided_dialogue

  • Descripción:

El conjunto de datos de Diálogo guiado por esquemas (SGD) consta de más de 20.000 conversaciones multidominio y orientadas a tareas con anotaciones entre un ser humano y un asistente virtual. Estas conversaciones involucran interacciones con servicios y API que abarcan 20 dominios, que van desde bancos y eventos hasta medios, calendario, viajes y clima. Para la mayoría de estos dominios, el conjunto de datos contiene varias API diferentes, muchas de las cuales tienen funcionalidades superpuestas pero diferentes interfaces, lo que refleja escenarios comunes del mundo real. La amplia gama de anotaciones disponibles se puede utilizar para la predicción de intenciones, el llenado de espacios, el seguimiento del estado de diálogo, el aprendizaje de imitación de políticas, la generación de idiomas, el aprendizaje de simulación de usuarios, entre otras tareas en asistentes virtuales a gran escala. Además de estos, el conjunto de datos tiene dominios y servicios invisibles en el conjunto de evaluación para cuantificar el rendimiento en configuraciones de disparo cero o pocos disparos.

Separar Ejemplos de
'dev' 2,482
'test' 4.201
'train' 16.142
  • características:
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': tf.string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • Cita:
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}