- Deskripsi :
Ini adalah kumpulan data untuk mengklasifikasikan maksud kutipan dalam makalah akademis. Label maksud kutipan utama untuk setiap objek Json ditentukan dengan kunci label sementara konteks kutipan ditentukan dengan kunci konteks. Contoh: {'string': 'Pada babun chacma, hubungan laki-laki-bayi dapat dikaitkan dengan pembentukan persahabatan dan kesuksesan ayah [30,31].' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ...} Anda dapat memperoleh informasi lengkap tentang kertas menggunakan id kertas yang tersedia dengan Semantic Scholar API ( https://api.semanticscholar.org/ ). Labelnya adalah: Metode, Latar Belakang, Hasil
Situs web : https://github.com/allenai/scicite
Kode sumber :
tfds.text.Scicite
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
22.12 MiB
Ukuran kumpulan data :
Unknown size
Cache otomatis ( dokumentasi ): Tidak diketahui
Split :
Membagi | Contoh |
---|---|
'test' | 1.859 |
'train' | 8.194 |
'validation' | 916 |
- Fitur :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('string', 'label')
Kutipan :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):