scicite

  • Descrizione :

Questo è un set di dati per classificare gli intenti di citazione negli articoli accademici. L'etichetta dell'intento di citazione principale per ogni oggetto Json viene specificata con la chiave dell'etichetta mentre il contesto della citazione viene specificato con una chiave di contesto. Esempio:

{
 'string': 'In chacma baboons, male-infant relationships can be linked to both
    formation of friendships and paternity success [30,31].'
 'sectionName': 'Introduction',
 'label': 'background',
 'citingPaperId': '7a6b2d4b405439',
 'citedPaperId': '9d1abadc55b5e0',
 ...
 }

È possibile ottenere le informazioni complete sull'articolo utilizzando gli ID carta forniti con l'API Semantic Scholar ( https://api.semanticscholar.org/ ).

Le etichette sono: Metodo, Sfondo, Risultato

Diviso Esempi
'test' 1.859
'train' 8.194
'validation' 916
  • Struttura delle caratteristiche :
FeaturesDict({
    'citeEnd': int64,
    'citeStart': int64,
    'citedPaperId': Text(shape=(), dtype=string),
    'citingPaperId': Text(shape=(), dtype=string),
    'excerpt_index': int32,
    'id': Text(shape=(), dtype=string),
    'isKeyCitation': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label2_confidence': float32,
    'label_confidence': float32,
    'sectionName': Text(shape=(), dtype=string),
    'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'string': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
citeFine Tensore int64
citeStart Tensore int64
citatoPaperId Testo corda
citando PaperId Testo corda
estratto_indice Tensore int32
id Testo corda
isKeyCitation Tensore bool
etichetta ClassLabel int64
etichetta2 ClassLabel int64
label2_confidence Tensore galleggiante32
etichetta_confidenza Tensore galleggiante32
sectionName Testo corda
fonte ClassLabel int64
corda Testo corda
  • Citazione :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}