- Deskripsi :
Ini adalah kumpulan data untuk mengklasifikasikan maksud kutipan dalam makalah akademis. Label maksud kutipan utama untuk setiap objek Json ditentukan dengan kunci label sedangkan konteks kutipan ditentukan dengan kunci konteks. Contoh: { 'string': 'Dalam chacma babon, hubungan laki-laki-bayi dapat dikaitkan dengan pembentukan persahabatan dan keberhasilan ayah [30,31].' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } Anda dapat memperoleh informasi lengkap tentang makalah menggunakan id kertas yang disediakan dengan API Cendekia Semantik ( https://api.semanticscholar.org/ ). Labelnya adalah: Metode, Latar Belakang, Hasil
Situs web : https://github.com/allenai/scicite
Kode sumber :
tfds.text.Scicite
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
22.12 MiB
Ukuran kumpulan data :
Unknown size
Cache otomatis ( dokumentasi ): Tidak diketahui
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1,859 |
'train' | 8.194 |
'validation' | 916 |
- Struktur fitur :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
kutipAkhir | Tensor | tf.int64 | ||
mengutipMulai | Tensor | tf.int64 | ||
dikutipPaperId | Teks | tf.string | ||
mengutip PaperId | Teks | tf.string | ||
kutipan_indeks | Tensor | tf.int32 | ||
pengenal | Teks | tf.string | ||
adalahKunciCitation | Tensor | tf.bool | ||
label | Label Kelas | tf.int64 | ||
label2 | Label Kelas | tf.int64 | ||
label2_keyakinan | Tensor | tf.float32 | ||
label_keyakinan | Tensor | tf.float32 | ||
nama bagian | Teks | tf.string | ||
sumber | Label Kelas | tf.int64 | ||
rangkaian | Teks | tf.string |
Kunci yang diawasi (Lihat
as_supervised
doc ):('string', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- kutipan :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}