scicite

  • Description:

Il s'agit d'un ensemble de données permettant de classer les intentions de citation dans les articles universitaires. L'étiquette d'intention de citation principale pour chaque objet Json est spécifiée avec la clé d'étiquette tandis que le contexte de citation est spécifié avec une clé de contexte. Exemple : { 'string': 'Chez les babouins chacma, les relations homme-nourrisson peuvent être liées à la fois à la formation d'amitiés et à la réussite de la paternité [30,31].' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } Vous pouvez obtenir toutes les informations sur le papier en utilisant les identifiants de papier fournis avec l'API sémantique Scholar ( https://api.semanticscholar.org/ ). Les libellés sont : Méthode, Contexte, Résultat

Diviser Exemples
'test' 1 859
'train' 8 194
'validation' 916
  • Caractéristiques:
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • citation:
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}