qasc

  • Mô tả :

QASC là một bộ dữ liệu trả lời câu hỏi tập trung vào thành phần câu. Nó bao gồm 9.980 câu hỏi trắc nghiệm 8 chiều về khoa học ở trường phổ thông (8.134 bài luyện tập, 926 bài phát triển, 920 bài kiểm tra) và đi kèm với kho văn bản gồm 17 triệu câu.

Tách ra ví dụ
'test' 920
'train' 8.134
'validation' 926
  • Cấu trúc tính năng :
FeaturesDict({
    'answerKey': Text(shape=(), dtype=string),
    'choices': Sequence({
        'label': Text(shape=(), dtype=string),
        'text': Text(shape=(), dtype=string),
    }),
    'combinedfact': Text(shape=(), dtype=string),
    'fact1': Text(shape=(), dtype=string),
    'fact2': Text(shape=(), dtype=string),
    'formatted_question': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
câu trả lờiKey Chữ chuỗi
lựa chọn Sự nối tiếp
lựa chọn/nhãn Chữ chuỗi
lựa chọn/văn bản Chữ chuỗi
thực tế kết hợp Chữ chuỗi
sự thật1 Chữ chuỗi
sự thật2 Chữ chuỗi
định dạng_câu hỏi Chữ chuỗi
Tôi Chữ chuỗi
câu hỏi Chữ chuỗi
  • trích dẫn :
@article{allenai:qasc,
      author    = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
      title     = {QASC: A Dataset for Question Answering via Sentence Composition},
      journal   = {arXiv:1910.11473v2},
      year      = {2020},
}