schema_guided_dialogue

  • תיאור :

מערך הנתונים של Schema-Guided Dialogue (SGD) מורכב מיותר מ-20,000 שיחות מרובות דומיינים מוערות, מוכוונות משימות בין אדם לעוזר וירטואלי. שיחות אלו כוללות אינטראקציות עם שירותים וממשקי API המשתרעים על פני 20 תחומים, החל מבנקים ואירועים ועד מדיה, לוח שנה, נסיעות ומזג אוויר. עבור רוב התחומים הללו, מערך הנתונים מכיל מספר ממשקי API שונים, לרבים מהם יש פונקציות חופפות אך ממשקים שונים, המשקפים תרחישים נפוצים בעולם האמיתי. ניתן להשתמש במגוון הרחב של ההערות הזמינות לחיזוי כוונות, מילוי משבצות, מעקב אחר מצבי דיאלוג, למידת חיקוי מדיניות, יצירת שפה, לימוד סימולציית משתמשים, בין שאר משימות בעוזרים וירטואליים בקנה מידה גדול. מלבד אלה, למערך הנתונים יש תחומים ושירותים בלתי נראים בערכת ההערכה כדי לכמת את הביצועים בהגדרות של צילום אפס או צילום מועט.

לְפַצֵל דוגמאות
'dev' 2,482
'test' 4,201
'train' 16,142
  • מבנה תכונה :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
דובר ראשון ClassLabel int64
מטא נתונים FeaturesDict
מטא נתונים/שירותים סדר פעולות
מטא נתונים/שירותים/שם מוֹתֵחַ חוּט
התבטאויות רצף (טקסט) (אף אחד,) חוּט
  • ציטוט :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}