مخطط_إرشاد_حوار

  • الوصف :

تتكون مجموعة بيانات الحوار الموجه بالمخطط (SGD) من أكثر من 20 ألف محادثات مشروحة متعددة المجالات وموجهة نحو المهام بين مساعد بشري ومساعد افتراضي. تتضمن هذه المحادثات تفاعلات مع الخدمات وواجهات برمجة التطبيقات التي تغطي 20 مجالًا ، بدءًا من البنوك والأحداث إلى الوسائط والتقويم والسفر والطقس. بالنسبة لمعظم هذه المجالات ، تحتوي مجموعة البيانات على العديد من واجهات برمجة التطبيقات المختلفة ، والعديد منها لها وظائف متداخلة ولكن واجهات مختلفة ، مما يعكس سيناريوهات العالم الحقيقي الشائعة. يمكن استخدام المجموعة الواسعة من التعليقات التوضيحية المتاحة للتنبؤ بالهدف ، وملء الفتحات ، وتتبع حالة الحوار ، وتعلم محاكاة السياسة ، وتوليد اللغة ، وتعلم محاكاة المستخدم ، من بين مهام أخرى في المساعدين الظاهريين على نطاق واسع. إلى جانب ذلك ، تحتوي مجموعة البيانات على مجالات وخدمات غير مرئية في مجموعة التقييم لتحديد الأداء في إعدادات اللقطة الصفرية أو عدد قليل من إعدادات اللقطة.

انشق، مزق أمثلة
'dev' 2،482
'test' 4201
'train' 16،142
  • هيكل الميزة :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
المتحدث الأول ClassLabel int64
البيانات الوصفية الميزات
البيانات الوصفية / الخدمات تسلسل
البيانات الوصفية / الخدمات / الاسم موتر سلسلة
الأقوال تسلسل (نص) (لا أحد،) سلسلة
  • الاقتباس :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}