דיאלוג_bot_adversarial

 • תיאור :

סט נתונים של דיאלוג יריב של בוט.

מערכי נתונים של דיאלוג עם התווית פוגענית ממשימת Bot Adversarial Dialogue. הדיאלוגים נאספו על ידי בקשה מבני אדם לדבר יריב עם בוטים.

פרטים נוספים בעיתון .

@misc{xu2021recipes,
   title={Recipes for Safety in Open-domain Chatbots},
   author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
   year={2021},
   eprint={2010.07079},
   archivePrefix={arXiv},
   primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (תצורת ברירת המחדל)

 • תיאור תצורה : מערכי הנתונים של הדיאלוגים, מחולקים בפיצולי רכבת, אימות ובדיקה.

 • גודל הורדה : 3.06 MiB

 • גודל ערכת נתונים : 23.38 MiB

 • פיצולים :

לְפַצֵל דוגמאות
'test' 2,598
'train' 69,274
'valid' 7,002
 • מבנה תכונה :
FeaturesDict({
  'bot_persona': Sequence(Text(shape=(), dtype=string)),
  'dialogue_id': float32,
  'episode_done': bool,
  'id': Text(shape=(), dtype=string),
  'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
  'round_id': float32,
  'speaker_to_eval': Text(shape=(), dtype=string),
  'text': Text(shape=(), dtype=string),
})
 • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
bot_persona רצף (טקסט) (אף אחד,) חוּט הדמות המתחזה על ידי הבוט.
dialogue_id מוֹתֵחַ לצוף32
episode_done מוֹתֵחַ bool
תְעוּדַת זֶהוּת טֶקסט חוּט המזהה של המדגם.
תוויות ClassLabel int64
round_id מוֹתֵחַ לצוף32
רמקול_לערך טֶקסט חוּט דובר ההתבטאויות מתויג.
טֶקסט טֶקסט חוּט האמירה לסווג.

bot_adversarial_dialogue/human_nonadv_safety_eval

 • תיאור תצורה : ערכת הערכת בטיחות אנושית שהוערכה על ידי עובדים במיקור המונים על פגיעה.

 • גודל הורדה : 10.57 KiB

 • גודל מערך נתונים : 34.55 KiB

 • פיצולים :

לְפַצֵל דוגמאות
'test' 180
 • מבנה תכונה :
FeaturesDict({
  'episode_done': bool,
  'id': Text(shape=(), dtype=string),
  'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
  'text': Text(shape=(), dtype=string),
})
 • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_done מוֹתֵחַ bool
תְעוּדַת זֶהוּת טֶקסט חוּט המזהה של המדגם.
תוויות ClassLabel int64
טֶקסט טֶקסט חוּט האמירה לסווג.