아스카

  • 설명 :

ASQA는 모호한 팩토이드 질문에 초점을 맞춘 최초의 긴 형식 질문 답변 데이터 세트입니다. 이전의 긴 형식 답변 데이터 세트와 달리 각 질문에는 긴 형식 답변과 생성된 구절에서 답변할 수 있는 추출 질문-답변 쌍이 주석으로 추가됩니다. 생성된 긴 형식의 답변은 ROUGE 및 QA 정확도를 모두 사용하여 평가됩니다. 우리는 이러한 평가 메트릭이 인간의 판단과 잘 연관되어 있음을 보여주었습니다. 이 저장소에서 평가 코드와 함께 ASQA 데이터세트를 출시합니다. <a href="https://github.com/google-research/language/tree/master/language/asqa">https://github.com/google-research/language/tree/master/language/asqa</a>

나뉘다
'dev' 948
'train' 4,353
  • 기능 구조 :
FeaturesDict({
    'ambiguous_question': Text(shape=(), dtype=string),
    'annotations': Sequence({
        'knowledge': Sequence({
            'content': Text(shape=(), dtype=string),
            'wikipage': Text(shape=(), dtype=string),
        }),
        'long_answer': Text(shape=(), dtype=string),
    }),
    'qa_pairs': Sequence({
        'context': Text(shape=(), dtype=string),
        'question': Text(shape=(), dtype=string),
        'short_answers': Sequence(Text(shape=(), dtype=string)),
        'wikipage': Text(shape=(), dtype=string),
    }),
    'sample_id': int32,
    'wikipages': Sequence({
        'title': Text(shape=(), dtype=string),
        'url': Text(shape=(), dtype=string),
    }),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
ambiguous_question 텍스트 AmbigQA의 명확한 질문입니다.
주석 순서 ASQA 어노테이터가 구성한 모호한 질문에 대한 긴 형식의 답변입니다.
주석/지식 순서 추가 지식 조각 목록입니다.
주석/지식/콘텐츠 텍스트 Wikipedia의 한 구절.
주석/지식/위키페이지 텍스트 구절을 가져온 Wikipedia 페이지의 제목입니다.
주석/long_answer 텍스트 주석.
qa_pairs 순서 모호성 제거에 사용되는 AmbigQA의 Q&A 쌍입니다.
qa_pairs/컨텍스트 텍스트 추가 컨텍스트가 제공되었습니다.
qa_pairs/질문 텍스트
qa_pairs/short_answers 시퀀스(텍스트) (없음,) AmbigQA의 짧은 답변 목록입니다.
qa_pairs/위키페이지 텍스트 추가 컨텍스트를 가져온 Wikipedia 페이지의 제목입니다.
sample_id 텐서 int32
위키페이지 순서 AmbigQA 어노테이터가 방문한 Wikipedia 페이지 목록입니다.
위키페이지/제목 텍스트 Wikipedia 페이지의 제목입니다.
위키페이지/URL 텍스트 Wikipedia 페이지로 연결됩니다.
  • 인용 :
@misc{https://doi.org/10.48550/arxiv.2204.06092,
doi = {10.48550/ARXIV.2204.06092},
url = {https://arxiv.org/abs/2204.06092},
author = {Stelmakh, Ivan and Luan, Yi and Dhingra, Bhuwan and Chang, Ming-Wei},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {ASQA: Factoid Questions Meet Long-Form Answers},
publisher = {arXiv},
year = {2022},
copyright = {arXiv.org perpetual, non-exclusive license}
}