schema_guided_dialogue

  • Açıklama :

Şema Kılavuzlu Diyalog (SGD) veri seti, bir insan ve bir sanal asistan arasındaki 20 binden fazla açıklamalı çok alanlı, görev yönelimli konuşmalardan oluşur. Bu konuşmalar, bankalardan etkinliklere, medyadan takvime, seyahate ve hava durumuna kadar uzanan 20 etki alanını kapsayan hizmetler ve API'lerle etkileşimleri içerir. Bu alanların çoğu için, veri kümesi, çoğu örtüşen işlevlere ancak ortak gerçek dünya senaryolarını yansıtan farklı arabirimlere sahip birden çok farklı API içerir. Çok çeşitli ek açıklamalar, büyük ölçekli sanal asistanlardaki diğer görevlerin yanı sıra amaç tahmini, alan doldurma, diyalog durumu izleme, politika taklit öğrenimi, dil oluşturma, kullanıcı simülasyonu öğrenimi için kullanılabilir. Bunların yanı sıra, sıfır atış veya az atış ayarlarındaki performansı ölçmek için veri setinde değerlendirme setinde görünmeyen etki alanları ve hizmetler bulunur.

Bölmek örnekler
'dev' 2.482
'test' 4.201
'train' 16.142
  • Özellik yapısı :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
ilk_konuşmacı SınıfEtiketi int64
meta veri ÖzelliklerDict
meta veriler/hizmetler Sıra
meta veri/hizmetler/ad tensör sicim
sözler Sıra(Metin) (Hiçbiri,) sicim
  • Alıntı :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}