hellaswag

 • Mô tả :

Bộ dữ liệu HellaSwag là một điểm chuẩn cho Commonsense NLI. Nó bao gồm một bối cảnh và một số kết thúc hoàn thành bối cảnh.

 • Tài liệu bổ sung : Khám phá trên giấy tờ với mã

 • Trang chủ : https://rowanzellers.com/hellaswag/

 • Mã nguồn : tfds.text.Hellaswag

 • Phiên bản :

  • 0.0.1 : Không có ghi chú phát hành.
  • 1.0.0 : Thêm các phần tách riêng cho các bộ kiểm tra/xác thực trong miền và ngoài miền.
  • 1.1.0 (mặc định): Một thứ nguyên phân chia khác cho nguồn (wikihow so với Activitynet)
 • Kích thước tải xuống : 68.18 MiB

 • Kích thước tập dữ liệu : 107.45 MiB

 • Tự động lưu vào bộ đệm ( tài liệu ): Có

 • Chia tách :

Tách ra ví dụ
'test' 10,003
'test_ind_activitynet' 1.870
'test_ind_wikihow' 3.132
'test_ood_activitynet' 1.651
'test_ood_wikihow' 3.350
'train' 39,905
'train_activitynet' 14.740
'train_wikihow' 25,165
'validation' 10,042
'validation_ind_activitynet' 1.809
'validation_ind_wikihow' 3.192
'validation_ood_activitynet' 1,434
'validation_ood_wikihow' 3,607
 • Cấu trúc tính năng :
FeaturesDict({
  'activity_label': Text(shape=(), dtype=string),
  'context': Text(shape=(), dtype=string),
  'endings': Sequence(Text(shape=(), dtype=string)),
  'label': int32,
  'source_id': Text(shape=(), dtype=string),
  'split_type': Text(shape=(), dtype=string),
})
 • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hoạt động_nhãn Chữ sợi dây
định nghĩa bài văn Chữ sợi dây
kết thúc Trình tự (Văn bản) (Không có,) sợi dây
nhãn mác tenxơ int32
nguồn_id Chữ sợi dây
loại phân chia Chữ sợi dây
 • trích dẫn :
@inproceedings{zellers2019hellaswag,
  title={HellaSwag: Can a Machine Really Finish Your Sentence?},
  author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
  booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
  year={2019}
}