오픈북카

  • 설명 :

데이터 세트에는 5,957개의 4방향 객관식 질문이 포함되어 있습니다. 또한 5,167개의 크라우드 소싱 상식 사실과 각 질문이 원래 핵심 사실, 사람의 정확도 점수, 명확성 점수 및 익명의 크라우드 작업자와 관련된 확장된 버전의 학습/개발/테스트 질문을 제공합니다. ID.

나뉘다
'test' 500
'train' 4,957
'validation' 500
  • 기능 구조 :
FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'clarity': float32,
    'fact1': Text(shape=(), dtype=string),
    'humanScore': float32,
    'question': FeaturesDict({
        'choice_A': Text(shape=(), dtype=string),
        'choice_B': Text(shape=(), dtype=string),
        'choice_C': Text(shape=(), dtype=string),
        'choice_D': Text(shape=(), dtype=string),
        'stem': Text(shape=(), dtype=string),
    }),
    'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
답변키 클래스 레이블 int64
명쾌함 텐서 float32
사실1 텍스트
휴먼스코어 텐서 float32
의문 풍모Dict
질문/선택_A 텍스트
질문/선택_B 텍스트
질문/선택_C 텍스트
질문/선택_D 텍스트
질문/줄기 텍스트
turkId익명화됨 텍스트
  • 인용 :
@article{mihaylov2018can,
  title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal={arXiv preprint arXiv:1809.02789},
  year={2018}
}