لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

مخطط_إرشاد_الخطاب

  • الوصف :

تتكون مجموعة بيانات الحوار الموجه بالمخطط (SGD) من أكثر من 20 ألف محادثات مشروحة متعددة المجالات وموجهة نحو المهام بين مساعد بشري ومساعد افتراضي. تتضمن هذه المحادثات تفاعلات مع الخدمات وواجهات برمجة التطبيقات التي تغطي 20 مجالًا ، بدءًا من البنوك والأحداث إلى الوسائط والتقويم والسفر والطقس. بالنسبة لمعظم هذه المجالات ، تحتوي مجموعة البيانات على العديد من واجهات برمجة التطبيقات المختلفة ، والعديد منها لها وظائف متداخلة ولكن واجهات مختلفة ، مما يعكس سيناريوهات العالم الحقيقي الشائعة. يمكن استخدام المجموعة الواسعة من التعليقات التوضيحية المتاحة للتنبؤ بالهدف ، وملء الفتحات ، وتتبع حالة الحوار ، وتعلم محاكاة السياسة ، وتوليد اللغة ، وتعلم محاكاة المستخدم ، من بين مهام أخرى في المساعدين الظاهريين على نطاق واسع إلى جانب ذلك ، تحتوي مجموعة البيانات على مجالات وخدمات غير مرئية في مجموعة التقييم لتحديد الأداء في إعدادات اللقطة الصفرية أو عدد قليل من إعدادات اللقطة.

انشق، مزق أمثلة
'dev' 2،482
'test' 4201
'train' 16،142
  • الميزات :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': tf.string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • الاقتباس :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}