hellaswag

  • 説明:

HellaSwag データセットは、Commonsense NLI のベンチマークです。コンテキストと、コンテキストを完成させるいくつかのエンディングが含まれています。

スプリット
'test' 10,003
'test_ind_activitynet' 1,870
'test_ind_wikihow' 3,132
'test_ood_activitynet' 1,651
'test_ood_wikihow' 3,350
'train' 39,905
'train_activitynet' 14,740
'train_wikihow' 25,165
'validation' 10,042
'validation_ind_activitynet' 1,809
'validation_ind_wikihow' 3,192
'validation_ood_activitynet' 1,434
'validation_ood_wikihow' 3,607
  • 機能構造:
FeaturesDict({
    'activity_label': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'endings': Sequence(Text(shape=(), dtype=string)),
    'label': int32,
    'source_id': Text(shape=(), dtype=string),
    'split_type': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
活動ラベル文章ストリング
環境文章ストリング
エンディングシーケンス(テキスト) (なし、)ストリング
ラベルテンソルint32
source_id文章ストリング
分割タイプ文章ストリング
  • 引用
@inproceedings{zellers2019hellaswag,
    title={HellaSwag: Can a Machine Really Finish Your Sentence?},
    author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
    booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
    year={2019}
}