schema_guided_dialogue

  • Açıklama :

Şema Kılavuzlu Diyalog (SGD) veri seti, bir insan ve bir sanal asistan arasındaki 20 binden fazla açıklamalı çok alanlı, görev odaklı konuşmalardan oluşur. Bu konuşmalar, bankalar ve etkinliklerden medyaya, takvime, seyahate ve hava durumuna kadar 20 alana yayılan hizmetler ve API'ler ile etkileşimleri içerir. Bu etki alanlarının çoğu için, veri kümesi, çoğu örtüşen işlevlere ancak ortak gerçek dünya senaryolarını yansıtan farklı arabirimlere sahip birden çok farklı API içerir. Geniş kapsamlı ek açıklamalar, büyük ölçekli sanal asistanlardaki diğer görevlerin yanı sıra niyet tahmini, boşluk doldurma, diyalog durumu izleme, politika taklit öğrenme, dil oluşturma, kullanıcı simülasyonu öğrenme için kullanılabilir. Bunların yanı sıra, veri kümesi, sıfır atış veya birkaç atış ayarındaki performansı ölçmek için değerlendirme kümesinde görünmeyen etki alanlarına ve hizmetlere sahiptir.

Bölmek Örnekler
'dev' 2.482
'test' 4,201
'train' 16.142
  • Özellikler :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': tf.string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • alıntı :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}