- Deskripsi :
BIGPATENT, terdiri dari 1,3 juta catatan dokumen paten AS bersama dengan ringkasan abstraktif tertulis manusia. Setiap permohonan paten AS diajukan di bawah kode Cooperative Patent Classification (CPC). Ada sembilan kategori klasifikasi tersebut: A (Kebutuhan Manusia), B (Melakukan Operasi; Pengangkutan), C (Kimia; Metalurgi), D (Tekstil; Kertas), E (Konstruksi Tetap), F (Teknik Mesin; Petir; Pemanasan; Senjata; Peledakan), G (Fisika), H (Listrik), dan Y (Penandaan umum teknologi baru atau penampang)
Ada dua fitur: - deskripsi: penjelasan rinci tentang paten. - ringkasan: Abastract paten.
Situs web : https://evasharma.github.io/bigpatent/
Kode sumber :
tfds.summarization.BigPatent
Versi :
-
1.0.0
: kata-kata bertokenisasi dengan huruf kecil -
2.0.0
: Perbarui untuk menggunakan string mentah bersusun -
2.1.2
(default): Memperbaiki pembaruan ke string mentah berkerangka.
-
Ukuran unduhan :
9.45 GiB
Cache otomatis ( dokumentasi ): Tidak
Fitur :
FeaturesDict({
'abstract': Text(shape=(), dtype=tf.string),
'description': Text(shape=(), dtype=tf.string),
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('description', 'abstract')
Kutipan :
@misc{sharma2019bigpatent,
title={BIGPATENT: A Large-Scale Dataset for Abstractive and Coherent Summarization},
author={Eva Sharma and Chen Li and Lu Wang},
year={2019},
eprint={1906.03741},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
- Gambar ( tfds.show_examples ): Tidak didukung.
big_patent / all (konfigurasi default)
Deskripsi konfigurasi : Paten di bawah semua kategori.
Ukuran
35.17 GiB
data :35.17 GiB
Split :
Membagi | Contoh |
---|---|
'test' | 67.072 |
'train' | 1.207.222 |
'validation' | 67.068 |
- Contoh ( tfds.as_dataframe ):
big_patent / a
Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) a: Kebutuhan Manusia
Ukuran set data :
5.16 GiB
Split :
Membagi | Contoh |
---|---|
'test' | 9.675 |
'train' | 174.134 |
'validation' | 9.674 |
- Contoh ( tfds.as_dataframe ):
big_patent / b
Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) b: Melakukan Operasi; Mengangkut
Ukuran set data :
4.06 GiB
Split :
Membagi | Contoh |
---|---|
'test' | 8.974 |
'train' | 161.520 |
'validation' | 8.973 |
- Contoh ( tfds.as_dataframe ):
big_patent / c
Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) c: Kimia; Metalurgi
Ukuran set data :
3.63 GiB
Split :
Membagi | Contoh |
---|---|
'test' | 5.614 |
'train' | 101.042 |
'validation' | 5.613 |
- Contoh ( tfds.as_dataframe ):
big_patent / d
Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) d: Tekstil; Kertas
Ukuran
255.56 MiB
data :255.56 MiB
Split :
Membagi | Contoh |
---|---|
'test' | 565 |
'train' | 10.164 |
'validation' | 565 |
- Contoh ( tfds.as_dataframe ):
big_patent / e
Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) e: Konstruksi Tetap
Ukuran
871.40 MiB
data :871.40 MiB
Split :
Membagi | Contoh |
---|---|
'test' | 1.914 |
'train' | 34.443 |
'validation' | 1.914 |
- Contoh ( tfds.as_dataframe ):
big_patent / f
Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) f: Teknik Mesin; Petir; Pemanasan; Senjata; Peledakan
Ukuran set data :
2.06 GiB
Split :
Membagi | Contoh |
---|---|
'test' | 4.754 |
'train' | 85.568 |
'validation' | 4.754 |
- Contoh ( tfds.as_dataframe ):
big_patent / g
Config description : Patents under Cooperative Patent Classification (CPC) g: Fisika
Ukuran set data :
8.19 GiB
Split :
Membagi | Contoh |
---|---|
'test' | 14.386 |
'train' | 258.935 |
'validation' | 14.385 |
- Contoh ( tfds.as_dataframe ):
big_patent / jam
Config description : Patents under Cooperative Patent Classification (CPC) h: Electricity
Ukuran set data :
7.50 GiB
Split :
Membagi | Contoh |
---|---|
'test' | 14.279 |
'train' | 257.019 |
'validation' | 14.279 |
- Contoh ( tfds.as_dataframe ):
big_patent / y
Config description : Patents under Cooperative Patent Classification (CPC) y: Pemberian tag umum pada teknologi baru atau teknologi cross-sectional
Ukuran set data :
3.46 GiB
Split :
Membagi | Contoh |
---|---|
'test' | 6.911 |
'train' | 124.397 |
'validation' | 6.911 |
- Contoh ( tfds.as_dataframe ):