Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

big_patent

  • Deskripsi :

BIGPATENT, terdiri dari 1,3 juta catatan dokumen paten AS bersama dengan ringkasan abstraktif tertulis manusia. Setiap permohonan paten AS diajukan di bawah kode Cooperative Patent Classification (CPC). Ada sembilan kategori klasifikasi tersebut: A (Kebutuhan Manusia), B (Melakukan Operasi; Pengangkutan), C (Kimia; Metalurgi), D (Tekstil; Kertas), E (Konstruksi Tetap), F (Teknik Mesin; Petir; Pemanasan; Senjata; Peledakan), G (Fisika), H (Listrik), dan Y (Penandaan umum teknologi baru atau penampang)

Ada dua fitur: - deskripsi: penjelasan rinci tentang paten. - ringkasan: Abastract paten.

FeaturesDict({
    'abstract': Text(shape=(), dtype=tf.string),
    'description': Text(shape=(), dtype=tf.string),
})
  • Kunci yang diawasi (Lihat as_supervised doc ): ('description', 'abstract')

  • Kutipan :

@misc{sharma2019bigpatent,
    title={BIGPATENT: A Large-Scale Dataset for Abstractive and Coherent Summarization},
    author={Eva Sharma and Chen Li and Lu Wang},
    year={2019},
    eprint={1906.03741},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

big_patent / all (konfigurasi default)

  • Deskripsi konfigurasi : Paten di bawah semua kategori.

  • Ukuran 35.17 GiB data : 35.17 GiB

  • Split :

Membagi Contoh
'test' 67.072
'train' 1.207.222
'validation' 67.068

big_patent / a

  • Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) a: Kebutuhan Manusia

  • Ukuran set data : 5.16 GiB

  • Split :

Membagi Contoh
'test' 9.675
'train' 174.134
'validation' 9.674

big_patent / b

  • Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) b: Melakukan Operasi; Mengangkut

  • Ukuran set data : 4.06 GiB

  • Split :

Membagi Contoh
'test' 8.974
'train' 161.520
'validation' 8.973

big_patent / c

  • Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) c: Kimia; Metalurgi

  • Ukuran set data : 3.63 GiB

  • Split :

Membagi Contoh
'test' 5.614
'train' 101.042
'validation' 5.613

big_patent / d

  • Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) d: Tekstil; Kertas

  • Ukuran 255.56 MiB data : 255.56 MiB

  • Split :

Membagi Contoh
'test' 565
'train' 10.164
'validation' 565

big_patent / e

  • Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) e: Konstruksi Tetap

  • Ukuran 871.40 MiB data : 871.40 MiB

  • Split :

Membagi Contoh
'test' 1.914
'train' 34.443
'validation' 1.914

big_patent / f

  • Deskripsi konfigurasi : Paten di bawah Klasifikasi Paten Koperasi (CPC) f: Teknik Mesin; Petir; Pemanasan; Senjata; Peledakan

  • Ukuran set data : 2.06 GiB

  • Split :

Membagi Contoh
'test' 4.754
'train' 85.568
'validation' 4.754

big_patent / g

  • Config description : Patents under Cooperative Patent Classification (CPC) g: Fisika

  • Ukuran set data : 8.19 GiB

  • Split :

Membagi Contoh
'test' 14.386
'train' 258.935
'validation' 14.385

big_patent / jam

  • Config description : Patents under Cooperative Patent Classification (CPC) h: Electricity

  • Ukuran set data : 7.50 GiB

  • Split :

Membagi Contoh
'test' 14.279
'train' 257.019
'validation' 14.279

big_patent / y

  • Config description : Patents under Cooperative Patent Classification (CPC) y: Pemberian tag umum pada teknologi baru atau teknologi cross-sectional

  • Ukuran set data : 3.46 GiB

  • Split :

Membagi Contoh
'test' 6.911
'train' 124.397
'validation' 6.911