wiki_dialog

با مجموعه‌ها، منظم بمانید ذخیره و دسته‌بندی محتوا براساس اولویت‌های شما.

  • توضیحات :

WikiDialog یک مجموعه داده بزرگ از مکالمات جستجوی اطلاعات مصنوعی است. هر مکالمه در مجموعه داده شامل دو سخنران است که در یک قطعه از ویکی‌پدیای انگلیسی پایه گذاری شده‌اند: گفته‌های یک گوینده شامل جملات دقیق آن متن است. سخنران دیگر توسط یک مدل زبان بزرگ تولید می شود.

شکاف مثال ها
'train' 11,264,129
'validation' 113,822
  • ساختار ویژگی :
FeaturesDict({
    'author_num': Sequence(int32),
    'passage': Text(shape=(), dtype=string),
    'pid': Text(shape=(), dtype=string),
    'sentences': Sequence(Text(shape=(), dtype=string)),
    'title': Text(shape=(), dtype=string),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
نویسنده_تعداد دنباله (تنسور) (هیچ یک،) int32
گذر متن رشته
pid متن رشته
جمله ها دنباله (متن) (هیچ یک،) رشته
عنوان متن رشته
گفته ها دنباله (متن) (هیچ یک،) رشته
  • نقل قول :
@inproceedings{dai2022dialoginpainting,
  title={Dialog Inpainting: Turning Documents to Dialogs},
  author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
  booktitle={International Conference on Machine Learning (ICML)},
  year={2022},
  organization={PMLR}
}

wiki_dialog/OQ (پیکربندی پیش‌فرض)