Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

gov_report

  • Descripción:

El conjunto de datos de informes gubernamentales consta de informes escritos por agencias de investigación gubernamentales, incluido el Servicio de Investigación del Congreso y la Oficina de Responsabilidad del Gobierno de EE. UU.

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report / crs_whitespace (configuración predeterminada)

  • Descripción config: CRS informe con el resumen. Estructuras aplanadas y unidas por espacios en blanco. Este es el formato utilizado por el papel original.

  • Conjunto de datos de tamaño: 349.76 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 362
'train' 6.514
'validation' 362
  • características:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'reports': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

gov_report / gao_whitespace

  • Descripción config: informe de la GAO con estructuras de relieve aplanado y se unió por espacios en blanco. Este es el formato utilizado por el papel original.

  • Conjunto de datos de tamaño: 690.24 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 611
'train' 11,005
'validation' 612
  • características:
FeaturesDict({
    'fastfact': Text(shape=(), dtype=tf.string),
    'highlight': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'published_date': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'report': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
    'url': Text(shape=(), dtype=tf.string),
})

gov_report / crs_html

  • Descripción config: CRS informe con el resumen. Estructuras aplanadas y unidas por una nueva línea mientras se agregan etiquetas html. Las etiquetas sólo se añaden para secition_title en un formato como <h2>xxx<h2> .

  • Conjunto de datos de tamaño: 351.25 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 362
'train' 6.514
'validation' 362
  • características:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'reports': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

gov_report / gao_html

  • Descripción config: informe de la GAO con estructuras de relieve aplanado y acompañado por el salto de línea mientras que las etiquetas HTML complemento. Las etiquetas sólo se añaden para secition_title en un formato como <h2>xxx<h2> .

  • Conjunto de datos de tamaño: 692.72 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 611
'train' 11,005
'validation' 612
  • características:
FeaturesDict({
    'fastfact': Text(shape=(), dtype=tf.string),
    'highlight': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'published_date': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'report': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
    'url': Text(shape=(), dtype=tf.string),
})

gov_report / crs_json

  • Descripción config: CRS informe con el resumen. Estructuras representadas como json sin formato.

  • Conjunto de datos de tamaño: 361.92 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 362
'train' 6.514
'validation' 362
  • características:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'reports': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

gov_report / gao_json

  • Descripción config: informe de la GAO con estructuras de relieve representadas como JSON prima.

  • Conjunto de datos de tamaño: 712.82 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 611
'train' 11,005
'validation' 612
  • características:
FeaturesDict({
    'fastfact': Text(shape=(), dtype=tf.string),
    'highlight': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'published_date': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'report': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
    'url': Text(shape=(), dtype=tf.string),
})