mctaco

  • 説明

MC-TACOは、一時的な常識的な理解を必要とする13kの質問と回答のペアのデータセットです。データセットには、次の5つの時間プロパティが含まれています。

  1. 期間(イベントにかかる時間)
  2. 時間的順序(イベントの一般的な順序)
  3. 通常の時間(イベントが発生したとき)
  4. 頻度(イベントが発生する頻度)
  5. 定常性(状態が非常に長い間維持されるか、無期限に維持されるか)

このデータセットが、この特定のクラスの推論問題の将来の調査を促進できることを願っています。

スプリット
'test' 9,442
'validation' 3,783
  • 特長
FeaturesDict({
    'answer': Text(shape=(), dtype=tf.string),
    'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'question': Text(shape=(), dtype=tf.string),
    'sentence': Text(shape=(), dtype=tf.string),
})
  • 引用
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}