품질

  • 설명 :

객관식 장독해 데이터세트인 QualITY.

우리는 원시 버전만 제공합니다.

나뉘다
'dev' 230
'test' 232
'train' 300
  • 기능 구조 :
FeaturesDict({
    'article': Text(shape=(), dtype=string),
    'article_id': Text(shape=(), dtype=string),
    'difficults': Sequence(bool),
    'gold_labels': Sequence(int32),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'question_ids': Sequence(Text(shape=(), dtype=string)),
    'questions': Sequence(Text(shape=(), dtype=string)),
    'set_unique_id': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'topic': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'writer_id': Text(shape=(), dtype=string),
    'writer_labels': Sequence(int32),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
기사 텍스트
기사 ID 텍스트
어려움 시퀀스(텐서) (없음,) 부울
gold_labels 시퀀스(텐서) (없음,) int32
옵션 시퀀스(시퀀스(텍스트)) (없음, 없음)
질문 ID 시퀀스(텍스트) (없음,)
질문 시퀀스(텍스트) (없음,)
set_unique_id 텍스트
원천 텍스트
제목 텍스트
주제 텍스트
URL 텍스트
writer_id 텍스트
writer_labels 시퀀스(텐서) (없음,) int32
@article{pang2021quality,
  title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
  author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
  journal={arXiv preprint arXiv:2112.08608},
  year={2021}
}

품질/원시(기본 구성)

  • 구성 설명 : HTML이 포함된 원시.

  • 데이터 세트 크기 : 22.18 MiB

  • ( tfds.as_dataframe ):

품질/스트립

  • 구성 설명 : HTML이 제거되었습니다.

  • 데이터 세트 크기 : 20.73 MiB

  • ( tfds.as_dataframe ):