bot_adversarial_dialogue

  • विवरण :

बॉट एडवरसैरियल डायलॉग डेटासेट।

बॉट एडवरसैरियल डायलॉग कार्य से संवाद डेटासेट को आक्रामकता के साथ लेबल किया गया। संवादों को मनुष्यों से बॉट्स से प्रतिकूल रूप से बात करने के लिए कहकर एकत्र किया गया था।

पेपर में अधिक विवरण।

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialog_datasets (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िगरेशन विवरण : संवाद डेटासेट, ट्रेन, सत्यापन और परीक्षण विभाजन में विभाजित।

  • डाउनलोड आकार : 3.06 MiB

  • डेटासेट का आकार : 23.38 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,598
'train' 69,274
'valid' 7,002
  • फ़ीचर संरचना :
FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
bot_persona अनुक्रम(पाठ) (कोई नहीं,) डोरी बॉट द्वारा प्रतिरूपित व्यक्तित्व।
संवाद_आईडी टेन्सर फ्लोट32
एपिसोड_हो गया टेन्सर बूल
पहचान मूलपाठ डोरी नमूने की आईडी.
लेबल क्लास लेबल int64
राउंड_आईडी टेन्सर फ्लोट32
स्पीकर_टू_इवल मूलपाठ डोरी कथनों के वक्ता को लेबल किया गया।
मूलपाठ मूलपाठ डोरी वर्गीकरण करने का कथन।

bot_adversarial_dialog/ human_nonadv_safety_eval

  • कॉन्फ़िगरेशन विवरण : एक मानव सुरक्षा मूल्यांकन सेट जिसका आक्रामकता के लिए क्राउडसोर्स्ड कार्यकर्ताओं द्वारा मूल्यांकन किया गया।

  • डाउनलोड आकार : 10.57 KiB

  • डेटासेट का आकार : 34.55 KiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 180
  • फ़ीचर संरचना :
FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
एपिसोड_हो गया टेन्सर बूल
पहचान मूलपाठ डोरी नमूने की आईडी.
लेबल क्लास लेबल int64
मूलपाठ मूलपाठ डोरी वर्गीकरण करने का कथन।