schema_guided_dialogue

  • Descrição :

O conjunto de dados Schema-Guided Dialogue (SGD) consiste em mais de 20 mil conversas multidomínio anotadas e orientadas a tarefas entre um humano e um assistente virtual. Essas conversas envolvem interações com serviços e APIs abrangendo 20 domínios, desde bancos e eventos até mídia, calendário, viagens e clima. Para a maioria desses domínios, o conjunto de dados contém várias APIs diferentes, muitas das quais têm funcionalidades sobrepostas, mas interfaces diferentes, o que reflete cenários comuns do mundo real. A ampla gama de anotações disponíveis pode ser usada para previsão de intenção, preenchimento de slots, rastreamento de estado de diálogo, aprendizado de imitação de política, geração de linguagem, aprendizado de simulação de usuário, entre outras tarefas em assistentes virtuais de grande escala. Além desses, o conjunto de dados possui domínios e serviços não vistos no conjunto de avaliação para quantificar o desempenho em configurações de disparo zero ou poucos disparos.

Dividir Exemplos
'dev' 2.482
'test' 4.201
'train' 16.142
  • Estrutura de recursos :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
primeiro_falante ClassLabel int64
metadados RecursosDict
metadados/serviços Seqüência
metadados/serviços/nome tensor fragmento
enunciados Sequência (Texto) (Nenhum,) fragmento
  • Citação :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}