09:00 पीएसटी पर एमएल संगोष्ठी इस मंगलवार, 19 अक्टूबर में पहले महिलाओं में ट्यून रजिस्टर अब

स्कीमा_गाइडेड_डायलॉग

  • विवरण:

स्कीमा-गाइडेड डायलॉग (SGD) डेटासेट में मानव और आभासी सहायक के बीच 20k से अधिक एनोटेट किए गए बहु-डोमेन, कार्य-उन्मुख वार्तालाप शामिल हैं। इन वार्तालापों में बैंकों और घटनाओं से लेकर मीडिया, कैलेंडर, यात्रा और मौसम तक 20 डोमेन में फैली सेवाओं और एपीआई के साथ बातचीत शामिल है। इनमें से अधिकांश डोमेन के लिए, डेटासेट में कई अलग-अलग एपीआई होते हैं, जिनमें से कई में अतिव्यापी कार्यक्षमता होती है लेकिन अलग-अलग इंटरफेस होते हैं, जो सामान्य वास्तविक दुनिया के परिदृश्यों को दर्शाता है। उपलब्ध एनोटेशन की विस्तृत श्रृंखला का उपयोग बड़े पैमाने के आभासी सहायकों में अन्य कार्यों के बीच, इरादे की भविष्यवाणी, स्लॉट भरने, संवाद स्थिति पर नज़र रखने, नीति की नकल सीखने, भाषा निर्माण, उपयोगकर्ता सिमुलेशन सीखने के लिए किया जा सकता है। इनके अलावा, शून्य-शॉट या कुछ शॉट सेटिंग्स में प्रदर्शन को मापने के लिए सेट किए गए मूल्यांकन में डेटासेट में अनदेखी डोमेन और सेवाएं हैं।

विभाजित करना उदाहरण
'dev' २,४८२
'test' 4,201
'train' 16,142
  • विशेषताएं:
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': tf.string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • प्रशस्ति पत्र:
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}