bot_adversarial_dialogue

  • Opis :

Zbiór danych dialogu kontradyktoryjnego botów.

Zestawy danych dialogu oznaczone jako obraźliwe z zadania dialogu kontradyktoryjnego z botami. Dialogi zebrano poprzez poproszenie ludzi o kontradyktoryjną rozmowę z botami.

Więcej szczegółów w artykule .

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (konfiguracja domyślna)

  • Opis konfiguracji : Zestawy danych dialogowych podzielone na części pociągowe, walidacyjne i testowe.

  • Rozmiar pliku do pobrania : 3.06 MiB

  • Rozmiar zbioru danych : 23.38 MiB

  • Podziały :

Podział Przykłady
'test' 2598
'train' 69274
'valid' 7002
  • Struktura funkcji :
FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
bot_persona Sekwencja (tekst) (Nic,) strunowy Osoba, pod którą podszywa się bot.
identyfikator_dialogu Napinacz pływak32
odcinek_skończony Napinacz bool
ID Tekst strunowy Identyfikator próbki.
etykiety Etykieta klasy int64
okrągły_id Napinacz pływak32
głośnik_do_eval Tekst strunowy Osoba mówiąca wypowiedzi oznaczone.
tekst Tekst strunowy Wyrażenie do sklasyfikowania.

bot_adversarial_dialogue/human_nonadv_safety_eval

  • Opis konfiguracji : zestaw oceny bezpieczeństwa ludzi oceniony przez pracowników korzystających z crowdsourcingu pod kątem obraźliwości.

  • Rozmiar pliku do pobrania : 10.57 KiB

  • Rozmiar zbioru danych : 34.55 KiB

  • Podziały :

Podział Przykłady
'test' 180
  • Struktura funkcji :
FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
odcinek_skończony Napinacz bool
ID Tekst strunowy Identyfikator próbki.
etykiety Etykieta klasy int64
tekst Tekst strunowy Wyrażenie do sklasyfikowania.