Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

big_patent

  • Descripción:

BIGPATENT, que consta de 1.3 millones de registros de documentos de patentes de EE. UU. Junto con resúmenes abstractivos escritos por humanos. Cada solicitud de patente de EE. UU. Se presenta bajo un código de Clasificación Cooperativa de Patentes (CPC). Hay nueve categorías de clasificación: A (Necesidades humanas), B (Realización de operaciones; Transporte), C (Química; Metalurgia), D (Textiles; Papel), E (Construcciones fijas), F (Ingeniería mecánica; Iluminación; Calefacción; Armas; Explosión), G (Física), H (Electricidad) e Y (Etiquetado general de tecnología nueva o transversal)

Hay dos características: - descripción: descripción detallada de la patente. - resumen: resumen de patente.

FeaturesDict({
    'abstract': Text(shape=(), dtype=tf.string),
    'description': Text(shape=(), dtype=tf.string),
})
@misc{sharma2019bigpatent,
    title={BIGPATENT: A Large-Scale Dataset for Abstractive and Coherent Summarization},
    author={Eva Sharma and Chen Li and Lu Wang},
    year={2019},
    eprint={1906.03741},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

big_patent / all (configuración predeterminada)

  • Descripción config: Las patentes en todas las categorías.

  • Tamaño de conjunto de datos: 35.17 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 67,072
'train' 1.207.222
'validation' 67,068

big_patent / a

  • Descripción Config: Patentes bajo Clasificación de patentes Cooperative (CPC) a: Necesidades Humanos

  • Tamaño de conjunto de datos: 5.16 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 9,675
'train' 174,134
'validation' 9,674

big_patent / b

  • Descripción Config: Patentes bajo Clasificación de patentes Cooperative (CPC) B: Realización de operaciones; Transportar

  • Tamaño de conjunto de datos: 4.06 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 8,974
'train' 161,520
'validation' 8,973

big_patent / c

  • Descripción Config: Patentes bajo Clasificación de patentes Cooperative (CPC) c: Chemistry; Metalurgia

  • Tamaño de conjunto de datos: 3.63 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 5.614
'train' 101,042
'validation' 5.613

big_patent / d

  • Descripción Config: Patentes bajo Clasificación de patentes Cooperative (CPC) d: Textil; Papel

  • Conjunto de datos de tamaño: 255.56 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 565
'train' 10.164
'validation' 565

big_patent / e

  • Descripción Config: Patentes bajo Clasificación de patentes Cooperative (CPC) e: fijo Construcciones

  • Conjunto de datos de tamaño: 871.40 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 1,914
'train' 34,443
'validation' 1,914

big_patent / f

  • Descripción Config: Patentes bajo Clasificación de patentes Cooperative (CPC) f: Ingeniería Mecánica; Relámpago; Calefacción; Armas; Voladura

  • Tamaño de conjunto de datos: 2.06 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 4.754
'train' 85,568
'validation' 4.754

big_patent / g

  • Descripción Config: Patentes bajo Clasificación Cooperativa de Patentes (CPC) g: Physics

  • Tamaño de conjunto de datos: 8.19 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 14.386
'train' 258,935
'validation' 14.385

big_patent / h

  • Descripción Config: Patentes bajo Clasificación de patentes Cooperative (CPC) h: Electricidad

  • Tamaño Conjunto de datos: 7.50 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 14,279
'train' 257,019
'validation' 14,279

big_patent / año

  • Descripción Config: Patentes bajo Clasificación de patentes Cooperative (CPC) Y: de marcado general de la tecnología nueva o de la sección transversal

  • Tamaño de conjunto de datos: 3.46 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 6,911
'train' 124,397
'validation' 6,911