- תיאור :
מערך הנתונים של Schema-Guided Dialogue (SGD) מורכב מיותר מ-20,000 שיחות מרובות דומיינים מוערות, מוכוונות משימות בין אדם לעוזר וירטואלי. שיחות אלו כוללות אינטראקציות עם שירותים וממשקי API המשתרעים על פני 20 תחומים, החל מבנקים ואירועים ועד מדיה, לוח שנה, נסיעות ומזג אוויר. עבור רוב התחומים הללו, מערך הנתונים מכיל מספר ממשקי API שונים, לרבים מהם יש פונקציות חופפות אך ממשקים שונים, המשקפים תרחישים נפוצים בעולם האמיתי. ניתן להשתמש במגוון הרחב של ההערות הזמינות לחיזוי כוונות, מילוי משבצות, מעקב אחר מצבי דיאלוג, למידת חיקוי מדיניות, יצירת שפה, לימוד סימולציית משתמשים, בין שאר משימות בעוזרים וירטואליים בקנה מידה גדול. מלבד אלה, למערך הנתונים יש תחומים ושירותים בלתי נראים בערכת ההערכה כדי לכמת את הביצועים בהגדרות של צילום אפס או צילום מועט.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
קוד מקור :
tfds.datasets.schema_guided_dialogue.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
35.12 MiB
גודל מערך נתונים :
25.36 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'dev' | 2,482 |
'test' | 4,201 |
'train' | 16,142 |
- מבנה תכונה :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
דובר ראשון | ClassLabel | int64 | ||
מטא נתונים | FeaturesDict | |||
מטא נתונים/שירותים | סדר פעולות | |||
מטא נתונים/שירותים/שם | מוֹתֵחַ | חוּט | ||
התבטאויות | רצף (טקסט) | (אף אחד,) | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}