O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

mctaco

  • Descrição:

MC-TACO é um conjunto de dados de 13 mil pares de perguntas e respostas que requerem compreensão temporal de senso comum. O conjunto de dados contém cinco propriedades temporais:

  1. duração (quanto tempo leva um evento)
  2. ordenação temporal (ordem típica de eventos)
  3. hora típica (quando ocorre um evento)
  4. frequência (com que frequência um evento ocorre)
  5. estacionariedade (se um estado é mantido por muito tempo ou indefinidamente)

Esperamos que este conjunto de dados possa promover a exploração futura desta classe particular de problemas de raciocínio.

Dividir Exemplos
'test' 9.442
'validation' 3.783
  • Características:
FeaturesDict({
    'answer': Text(shape=(), dtype=tf.string),
    'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'question': Text(shape=(), dtype=tf.string),
    'sentence': Text(shape=(), dtype=tf.string),
})
  • citação:
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}