schema_guided_dialogue

با مجموعه‌ها، منظم بمانید ذخیره و دسته‌بندی محتوا براساس اولویت‌های شما.

  • توضیحات :

مجموعه داده گفتگوی هدایت‌شده طرحواره (SGD) شامل بیش از 20 هزار گفتگوی چند دامنه‌ای مشروح شده و وظیفه‌محور بین یک انسان و یک دستیار مجازی است. این مکالمات شامل تعامل با سرویس‌ها و API‌هایی است که 20 حوزه را شامل می‌شود، از بانک‌ها و رویدادها گرفته تا رسانه‌ها، تقویم، سفر و آب‌وهوا. برای اکثر این دامنه ها، مجموعه داده شامل چندین API مختلف است که بسیاری از آنها دارای عملکردهای همپوشانی هستند اما رابط های متفاوتی دارند که سناریوهای رایج دنیای واقعی را منعکس می کند. طیف گسترده ای از حاشیه نویسی های موجود را می توان برای پیش بینی قصد، پر کردن شکاف، ردیابی وضعیت گفتگو، یادگیری تقلید خط مشی، تولید زبان، یادگیری شبیه سازی کاربر، از جمله کارهای دیگر در دستیاران مجازی در مقیاس بزرگ استفاده کرد. علاوه بر اینها، مجموعه داده دارای حوزه‌ها و سرویس‌های دیده نشده در مجموعه ارزیابی برای تعیین کمیت عملکرد در تنظیمات صفر یا چند شات است.

شکاف مثال ها
'dev' 2,482
'test' 4,201
'train' 16,142
  • ساختار ویژگی :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
first_speaker ClassLabel int64
فراداده FeaturesDict
فراداده / خدمات توالی
فراداده/خدمات/نام تانسور رشته
گفته ها دنباله (متن) (هیچ یک،) رشته
  • نقل قول :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}