bot_adversarial_dialogue

설명 :

봇의 적대적 대화 데이터세트.

Bot Adversarial Dialogue 작업의 공격성 라벨이 지정된 대화 데이터 세트입니다. 대화는 인간에게 봇과 적대적으로 대화하도록 요청하여 수집되었습니다.

자세한 내용은 논문 에서 확인하세요.

홈페이지 : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
소스 코드 : tfds.datasets.bot_adversarial_dialogue.Builder
버전 :
- 1.0.0 (기본값): 최초 릴리스입니다.
자동 캐시 ( 문서 ): 예
감독되는 키 ( as_supervised doc 참조): None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (기본 구성)

구성 설명 : 학습, 검증 및 테스트 분할로 구분된 대화 데이터 세트입니다.
다운로드 크기 : 3.06 MiB
데이터세트 크기 : 23.38 MiB
분할 :

나뉘다	예
`'test'`	2,598
`'train'`	69,274
`'valid'`	7,002

기능 구조 :

FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

기능 문서 :

특징	수업	모양	Dtype	설명
	특징Dict
bot_persona	시퀀스(텍스트)	(없음,)	끈	봇이 가장한 페르소나입니다.
대화_ID	텐서		float32
에피소드_완료	텐서		부울
ID	텍스트		끈	샘플의 ID입니다.
라벨	클래스 라벨		정수64
round_id	텐서		float32
Speaker_to_eval	텍스트		끈	라벨이 붙은 발화의 화자입니다.
텍스트	텍스트		끈	분류할 발화입니다.

예 ( tfds.as_dataframe ):

bot_adversarial_dialogue/human_nonadv_safety_eval

구성 설명 : 크라우드소싱 작업자가 공격성을 평가한 인간 안전 평가 세트입니다.
다운로드 크기 : 10.57 KiB
데이터세트 크기 : 34.55 KiB
분할 :

나뉘다	예
`'test'`	180

기능 구조 :

FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})

기능 문서 :

특징	수업	Dtype	설명
	특징Dict
에피소드_완료	텐서	부울
ID	텍스트	끈	샘플의 ID입니다.
라벨	클래스 라벨	정수64
텍스트	텍스트	끈	분류할 발화입니다.

예 ( tfds.as_dataframe ):

bot_adversarial_dialogue 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

봇의 적대적 대화 데이터세트.

bot_adversarial_dialogue/dialogue_datasets (기본 구성)

bot_adversarial_dialogue/human_nonadv_safety_eval

bot_adversarial_dialogue