O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

schema_guided_dialogue

  • Descrição:

O conjunto de dados Schema-Guided Dialogue (SGD) consiste em mais de 20 mil conversas anotadas de vários domínios e orientadas a tarefas entre um humano e um assistente virtual. Essas conversas envolvem interações com serviços e APIs que abrangem 20 domínios, desde bancos e eventos até mídia, calendário, viagens e clima. Para a maioria desses domínios, o conjunto de dados contém várias APIs diferentes, muitas das quais têm funcionalidades sobrepostas, mas interfaces diferentes, que refletem cenários comuns do mundo real. A ampla gama de anotações disponíveis pode ser usada para previsão de intenção, preenchimento de slot, rastreamento de estado de diálogo, aprendizagem de imitação de política, geração de linguagem, aprendizagem de simulação de usuário, entre outras tarefas em assistentes virtuais em grande escala. Além desses, o conjunto de dados possui domínios e serviços invisíveis no conjunto de avaliação para quantificar o desempenho em configurações de tiro zero ou poucos instantes.

Dividir Exemplos
'dev' 2.482
'test' 4.201
'train' 16.142
  • Características:
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': tf.string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • citação:
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}