bot_adversarial_dialogue

  • توضیحات :

مجموعه داده های گفتگوی متخاصم ربات.

مجموعه داده‌های گفتگو با برچسب توهین‌آمیز از کار Bot Adversarial Dialogue. دیالوگ ها با درخواست از انسان ها برای گفتگو با ربات ها جمع آوری شد.

جزئیات بیشتر در مقاله

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (پیکربندی پیش‌فرض)

  • توضیحات پیکربندی : مجموعه داده‌های گفتگو، به تقسیم‌بندی قطار، اعتبارسنجی و آزمایش تقسیم می‌شوند.

  • حجم دانلود : 3.06 MiB

  • حجم مجموعه داده : 23.38 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2598
'train' 69274
'valid' 7002
  • ساختار ویژگی :
FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
bot_persona دنباله (متن) (هیچ یک،) رشته شخصیتی که ربات جعل کرده است.
dialogue_id تانسور float32
قسمت_انجام شد تانسور بوول
شناسه متن رشته شناسه نمونه
برچسب ها ClassLabel int64
round_id تانسور float32
speaker_to_eval متن رشته گوینده گفته های برچسب زده شده است.
متن متن رشته گفته برای طبقه بندی.

bot_adversarial_dialogue/human_nonadv_safety_eval

  • شرح پیکربندی : مجموعه ارزیابی ایمنی انسانی که توسط کارگران جمع‌سپاری برای توهین‌آمیز بودن ارزیابی می‌شود.

  • حجم دانلود : 10.57 KiB

  • حجم مجموعه داده : 34.55 KiB

  • تقسیم ها :

شکاف مثال ها
'test' 180
  • ساختار ویژگی :
FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
قسمت_انجام شد تانسور بوول
شناسه متن رشته شناسه نمونه
برچسب ها ClassLabel int64
متن متن رشته گفته برای طبقه بندی.