Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

gov_raport

  • opis:

Zbiór danych raportów rządowych składa się z raportów pisanych przez rządowe agencje badawcze, w tym Congressional Research Service i US Government Accountability Office.

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (konfiguracja domyślna)

  • Opis config: CRS raport z podsumowaniem. Struktury spłaszczone i połączone białymi znakami. Jest to format używany przez oryginalny papier

  • Zbiór danych rozmiar: 349.76 MiB

  • dzieli:

Podział Przykłady
'test' 362
'train' 6514
'validation' 362
  • Cechy:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'reports': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

gov_report/gao_whitespace

  • Opis config: raport GAO ze strukturami podświetleniem spłaszczone i połączone spacjami. Jest to format używany przez oryginalny papier

  • Zbiór danych rozmiar: 690.24 MiB

  • dzieli:

Podział Przykłady
'test' 611
'train' 11,005
'validation' 612
  • Cechy:
FeaturesDict({
    'fastfact': Text(shape=(), dtype=tf.string),
    'highlight': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'published_date': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'report': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
    'url': Text(shape=(), dtype=tf.string),
})

gov_report/crs_html

  • Opis config: CRS raport z podsumowaniem. Struktury spłaszczone i połączone znakiem nowej linii podczas dodawania znaczników html. Tagi dodawane są tylko dla secition_title w takim formacie jak <h2>xxx<h2> .

  • Zbiór danych rozmiar: 351.25 MiB

  • dzieli:

Podział Przykłady
'test' 362
'train' 6514
'validation' 362
  • Cechy:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'reports': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

gov_report/gao_html

  • Opis config: raport GAO ze strukturami podświetleniem spłaszczone i dołączyła nowa linia while tagi dodaj html. Tagi dodawane są tylko dla secition_title w takim formacie jak <h2>xxx<h2> .

  • Zbiór danych rozmiar: 692.72 MiB

  • dzieli:

Podział Przykłady
'test' 611
'train' 11 005
'validation' 612
  • Cechy:
FeaturesDict({
    'fastfact': Text(shape=(), dtype=tf.string),
    'highlight': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'published_date': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'report': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
    'url': Text(shape=(), dtype=tf.string),
})

gov_report/crs_json

  • Opis config: CRS raport z podsumowaniem. Struktury reprezentowane jako surowy json.

  • Zbiór danych rozmiar: 361.92 MiB

  • dzieli:

Podział Przykłady
'test' 362
'train' 6514
'validation' 362
  • Cechy:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'reports': Text(shape=(), dtype=tf.string),
    'summary': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})

gov_report/gao_json

  • Opis config: raport GAO ze strukturami podświetleniem reprezentowane surowego JSON.

  • Zbiór danych rozmiar: 712.82 MiB

  • dzieli:

Podział Przykłady
'test' 611
'train' 11,005
'validation' 612
  • Cechy:
FeaturesDict({
    'fastfact': Text(shape=(), dtype=tf.string),
    'highlight': Text(shape=(), dtype=tf.string),
    'id': Text(shape=(), dtype=tf.string),
    'published_date': Text(shape=(), dtype=tf.string),
    'released_date': Text(shape=(), dtype=tf.string),
    'report': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
    'url': Text(shape=(), dtype=tf.string),
})