gov_report

 • Açıklama :

Devlet raporu veri seti, Kongre Araştırma Servisi ve ABD Devlet Hesap Verebilirlik Ofisi dahil olmak üzere devlet araştırma kurumları tarafından yazılan raporlardan oluşur.

@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}

gov_report/crs_whitespace (varsayılan yapılandırma)

 • Yapılandırma açıklaması : Özet içeren CRS raporu. Düzleştirilmiş ve boşlukla birleştirilmiş yapılar. Bu, orijinal kağıt tarafından kullanılan biçimdir.

 • Veri kümesi boyutu : 349.76 MiB

 • Bölmeler :

Bölmek Örnekler
'test' 362
'train' 6.514
'validation' 362
 • Özellikler :
FeaturesDict({
  'id': Text(shape=(), dtype=tf.string),
  'released_date': Text(shape=(), dtype=tf.string),
  'reports': Text(shape=(), dtype=tf.string),
  'summary': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
})

gov_report/gao_whitespace

 • Yapılandırma açıklaması : Düzleştirilmiş ve boşlukla birleştirilmiş Yapıları vurgulayan GAO raporu. Bu, orijinal kağıt tarafından kullanılan biçimdir.

 • Veri kümesi boyutu : 690.24 MiB

 • Bölmeler :

Bölmek Örnekler
'test' 611
'train' 11.005
'validation' 612
 • Özellikler :
FeaturesDict({
  'fastfact': Text(shape=(), dtype=tf.string),
  'highlight': Text(shape=(), dtype=tf.string),
  'id': Text(shape=(), dtype=tf.string),
  'published_date': Text(shape=(), dtype=tf.string),
  'released_date': Text(shape=(), dtype=tf.string),
  'report': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
  'url': Text(shape=(), dtype=tf.string),
})

gov_report/crs_html

 • Yapılandırma açıklaması : Özet içeren CRS raporu. Html etiketleri eklenirken düzleştirilmiş ve yeni satırla birleştirilmiş yapılar. Etiketler yalnızca secition_title için <h2>xxx<h2> gibi bir biçimde eklenir.

 • Veri kümesi boyutu : 351.25 MiB

 • Bölmeler :

Bölmek Örnekler
'test' 362
'train' 6.514
'validation' 362
 • Özellikler :
FeaturesDict({
  'id': Text(shape=(), dtype=tf.string),
  'released_date': Text(shape=(), dtype=tf.string),
  'reports': Text(shape=(), dtype=tf.string),
  'summary': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
})

gov_report/gao_html

 • Yapılandırma açıklaması : html etiketleri eklenirken düzleştirilmiş ve yeni satırla birleştirilmiş vurgulu Yapıları içeren GAO raporu. Etiketler yalnızca secition_title için <h2>xxx<h2> gibi bir biçimde eklenir.

 • Veri kümesi boyutu : 692.72 MiB

 • Bölmeler :

Bölmek Örnekler
'test' 611
'train' 11.005
'validation' 612
 • Özellikler :
FeaturesDict({
  'fastfact': Text(shape=(), dtype=tf.string),
  'highlight': Text(shape=(), dtype=tf.string),
  'id': Text(shape=(), dtype=tf.string),
  'published_date': Text(shape=(), dtype=tf.string),
  'released_date': Text(shape=(), dtype=tf.string),
  'report': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
  'url': Text(shape=(), dtype=tf.string),
})

gov_report/crs_json

 • Yapılandırma açıklaması : Özet içeren CRS raporu. Ham json olarak temsil edilen yapılar.

 • Veri kümesi boyutu : 361.92 MiB

 • Bölmeler :

Bölmek Örnekler
'test' 362
'train' 6.514
'validation' 362
 • Özellikler :
FeaturesDict({
  'id': Text(shape=(), dtype=tf.string),
  'released_date': Text(shape=(), dtype=tf.string),
  'reports': Text(shape=(), dtype=tf.string),
  'summary': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
})

gov_report/gao_json

 • Yapılandırma açıklaması : Ham json olarak temsil edilen vurgulu Yapıları içeren GAO raporu.

 • Veri kümesi boyutu : 712.82 MiB

 • Bölmeler :

Bölmek Örnekler
'test' 611
'train' 11.005
'validation' 612
 • Özellikler :
FeaturesDict({
  'fastfact': Text(shape=(), dtype=tf.string),
  'highlight': Text(shape=(), dtype=tf.string),
  'id': Text(shape=(), dtype=tf.string),
  'published_date': Text(shape=(), dtype=tf.string),
  'released_date': Text(shape=(), dtype=tf.string),
  'report': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
  'url': Text(shape=(), dtype=tf.string),
})