বট_বিরোধী_সংলাপ

  • বর্ণনা :

বট প্রতিপক্ষের ডায়লগ ডেটাসেট।

বট অ্যাডভারসারিয়াল ডায়ালগ টাস্ক থেকে আপত্তিকরতার লেবেলযুক্ত ডায়ালগ ডেটাসেট। সংলাপগুলো সংগৃহীত হয়েছিল মানুষকে প্রতিপক্ষভাবে বটদের সাথে কথা বলতে বলে।

কাগজে আরো বিস্তারিত.

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বিবরণ : সংলাপ ডেটাসেট, ট্রেনে বিভক্ত, বৈধতা এবং পরীক্ষা বিভাজন।

  • ডাউনলোড আকার : 3.06 MiB

  • ডেটাসেটের আকার : 23.38 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,598
'train' 69,274
'valid' 7,002
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
বট_ব্যক্তিত্ব ক্রম (পাঠ্য) (কোনটিই নয়,) স্ট্রিং বট দ্বারা ছদ্মবেশিত ব্যক্তিত্ব।
dialogue_id টেনসর float32
episode_done টেনসর bool
আইডি পাঠ্য স্ট্রিং নমুনার আইডি।
লেবেল ক্লাসলেবেল int64
রাউন্ড_আইডি টেনসর float32
স্পিকার_থেকে_ইভাল পাঠ্য স্ট্রিং লেবেলযুক্ত উচ্চারণগুলির স্পিকার।
পাঠ্য পাঠ্য স্ট্রিং শ্রেণীবদ্ধ করার উচ্চারণ।

bot_adversarial_dialogue/human_nonadv_safety_eval

  • কনফিগারেশনের বিবরণ : আপত্তিকরতার জন্য ক্রাউডসোর্সড কর্মীদের দ্বারা মূল্যায়ন করা একটি মানব নিরাপত্তা মূল্যায়ন সেট।

  • ডাউনলোড সাইজ : 10.57 KiB

  • ডেটাসেটের আকার : 34.55 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 180
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
episode_done টেনসর bool
আইডি পাঠ্য স্ট্রিং নমুনার আইডি।
লেবেল ক্লাসলেবেল int64
পাঠ্য পাঠ্য স্ট্রিং শ্রেণীবদ্ধ করার উচ্চারণ।