gov_report

 • opis :

Zbiór danych raportów rządowych składa się z raportów napisanych przez rządowe agencje badawcze, w tym Congressional Research Service i US Government Accountability Office.

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (domyślna konfiguracja)

 • Opis konfiguracji : Raport CRS z podsumowaniem. Struktury spłaszczone i połączone odstępami. Jest to format używany przez oryginalny papier

 • Rozmiar zestawu danych : 349.76 MiB

 • Podziały :

Rozdzielać Przykłady
'test' 362
'train' 6514
'validation' 362
 • Struktura funkcji :
FeaturesDict({
  'id': Text(shape=(), dtype=string),
  'released_date': Text(shape=(), dtype=string),
  'reports': Text(shape=(), dtype=string),
  'summary': Text(shape=(), dtype=string),
  'title': Text(shape=(), dtype=string),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
ID Tekst strunowy
Data wypuszczenia Tekst strunowy
raporty Tekst strunowy
streszczenie Tekst strunowy
tytuł Tekst strunowy

gov_report/gao_whitespace

 • Opis konfiguracji: raport GAO z wyróżnionymi strukturami spłaszczonymi i połączonymi spacjami. Jest to format używany przez oryginalny papier

 • Rozmiar zestawu danych : 690.24 MiB

 • Podziały :

Rozdzielać Przykłady
'test' 611
'train' 11 005
'validation' 612
 • Struktura funkcji :
FeaturesDict({
  'fastfact': Text(shape=(), dtype=string),
  'highlight': Text(shape=(), dtype=string),
  'id': Text(shape=(), dtype=string),
  'published_date': Text(shape=(), dtype=string),
  'released_date': Text(shape=(), dtype=string),
  'report': Text(shape=(), dtype=string),
  'title': Text(shape=(), dtype=string),
  'url': Text(shape=(), dtype=string),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
szybki fakt Tekst strunowy
atrakcja Tekst strunowy
ID Tekst strunowy
Data publikacji Tekst strunowy
Data wypuszczenia Tekst strunowy
raport Tekst strunowy
tytuł Tekst strunowy
adres URL Tekst strunowy

gov_report/crs_html

 • Opis konfiguracji : Raport CRS z podsumowaniem. Struktury spłaszczone i połączone znakami nowej linii podczas dodawania tagów html. Tagi są dodawane tylko dla sekcji nazwa_sekcji w formacie takim jak <h2>xxx<h2> .

 • Rozmiar zestawu danych : 351.25 MiB

 • Podziały :

Rozdzielać Przykłady
'test' 362
'train' 6514
'validation' 362
 • Struktura funkcji :
FeaturesDict({
  'id': Text(shape=(), dtype=string),
  'released_date': Text(shape=(), dtype=string),
  'reports': Text(shape=(), dtype=string),
  'summary': Text(shape=(), dtype=string),
  'title': Text(shape=(), dtype=string),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
ID Tekst strunowy
Data wypuszczenia Tekst strunowy
raporty Tekst strunowy
streszczenie Tekst strunowy
tytuł Tekst strunowy

gov_report/gao_html

 • Opis konfiguracji: raport GAO z wyróżnionymi strukturami spłaszczonymi i połączonymi znakami nowej linii podczas dodawania tagów html. Tagi są dodawane tylko dla sekcji nazwa_sekcji w formacie takim jak <h2>xxx<h2> .

 • Rozmiar zbioru danych : 692.72 MiB

 • Podziały :

Rozdzielać Przykłady
'test' 611
'train' 11 005
'validation' 612
 • Struktura funkcji :
FeaturesDict({
  'fastfact': Text(shape=(), dtype=string),
  'highlight': Text(shape=(), dtype=string),
  'id': Text(shape=(), dtype=string),
  'published_date': Text(shape=(), dtype=string),
  'released_date': Text(shape=(), dtype=string),
  'report': Text(shape=(), dtype=string),
  'title': Text(shape=(), dtype=string),
  'url': Text(shape=(), dtype=string),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
szybki fakt Tekst strunowy
atrakcja Tekst strunowy
ID Tekst strunowy
Data publikacji Tekst strunowy
Data wypuszczenia Tekst strunowy
raport Tekst strunowy
tytuł Tekst strunowy
adres URL Tekst strunowy

gov_report/crs_json

 • Opis konfiguracji : Raport CRS z podsumowaniem. Struktury reprezentowane jako surowy json.

 • Rozmiar zestawu danych : 361.92 MiB

 • Podziały :

Rozdzielać Przykłady
'test' 362
'train' 6514
'validation' 362
 • Struktura funkcji :
FeaturesDict({
  'id': Text(shape=(), dtype=string),
  'released_date': Text(shape=(), dtype=string),
  'reports': Text(shape=(), dtype=string),
  'summary': Text(shape=(), dtype=string),
  'title': Text(shape=(), dtype=string),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
ID Tekst strunowy
Data wypuszczenia Tekst strunowy
raporty Tekst strunowy
streszczenie Tekst strunowy
tytuł Tekst strunowy

gov_report/gao_json

 • Opis konfiguracji: raport GAO z wyróżnionymi strukturami przedstawionymi jako nieprzetworzony plik json.

 • Rozmiar zbioru danych : 712.82 MiB

 • Podziały :

Rozdzielać Przykłady
'test' 611
'train' 11 005
'validation' 612
 • Struktura funkcji :
FeaturesDict({
  'fastfact': Text(shape=(), dtype=string),
  'highlight': Text(shape=(), dtype=string),
  'id': Text(shape=(), dtype=string),
  'published_date': Text(shape=(), dtype=string),
  'released_date': Text(shape=(), dtype=string),
  'report': Text(shape=(), dtype=string),
  'title': Text(shape=(), dtype=string),
  'url': Text(shape=(), dtype=string),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
szybki fakt Tekst strunowy
atrakcja Tekst strunowy
ID Tekst strunowy
Data publikacji Tekst strunowy
Data wypuszczenia Tekst strunowy
raport Tekst strunowy
tytuł Tekst strunowy
adres URL Tekst strunowy