O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

scicite

  • Descrição:

Este é um conjunto de dados para classificar as intenções de citação em artigos acadêmicos. O rótulo da intenção de citação principal para cada objeto Json é especificado com a chave do rótulo, enquanto o contexto da citação é especificado com uma chave de contexto. Exemplo: {'string': 'Em babuínos chacma, os relacionamentos entre meninos e bebês podem ser vinculados à formação de amizades e ao sucesso da paternidade [30,31].' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ...} Você pode obter as informações completas sobre o papel usando os IDs de papel fornecidos com a API Semantic Scholar ( https://api.semanticscholar.org/ ). Os rótulos são: Método, Fundo, Resultado

Dividir Exemplos
'test' 1.859
'train' 8.194
'validation' 916
  • Características:
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • citação:
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}