bigearthnet

Le BigEarthNet est une nouvelle archive de référence Sentinel-2 à grande échelle, composée de 590 326 patchs d'images Sentinel-2. La taille du patch d'image au sol est de 1,2 x 1,2 km avec une taille d'image variable en fonction de la résolution du canal. Il s'agit d'un ensemble de données multi-étiquettes avec 43 étiquettes déséquilibrées.

Pour construire le BigEarthNet, 125 tuiles Sentinel-2 acquises entre juin 2017 et mai 2018 sur les 10 pays (Autriche, Belgique, Finlande, Irlande, Kosovo, Lituanie, Luxembourg, Portugal, Serbie, Suisse) d'Europe ont été initialement sélectionnées. Toutes les tuiles ont été corrigées atmosphériquement par l'outil de génération et de formatage de produit Sentinel-2 niveau 2A (sen2cor). Ensuite, ils ont été divisés en 590 326 patchs d'image non superposés. Chaque patch d'image a été annoté par les multiples classes de couverture terrestre (c'est-à-dire, multi-étiquettes) qui ont été fournies à partir de la base de données CORINE Land Cover de l'année 2018 (CLC 2018).

Bandes et résolution en pixels en mètres :

  • B01 : Aérosol côtier ; 60m
  • B02 : bleu ; 10m
  • B03 : Vert ; 10m
  • B04 : Rouge ; 10m
  • B05 : bordure rouge végétation ; 20m
  • B06 : bordure rouge végétation ; 20m
  • B07 : bordure rouge végétation ; 20m
  • B08 : NIR ; 10m
  • B09 : Vapeur d'eau ; 60m
  • B11 : SWIR ; 20m
  • B12 : SWIR ; 20m
  • B8A : NIR étroit ; 20m

Licence : Accord de licence des données communautaires - Permissive, Version 1.0.

URL : http://bigearth.net/

Diviser Exemples
'train' 590 326
  • Citation :
@article{Sumbul2019BigEarthNetAL,
  title={BigEarthNet: A Large-Scale Benchmark Archive For Remote Sensing Image Understanding},
  author={Gencer Sumbul and Marcela Charfuelan and Beg{"u}m Demir and Volker Markl},
  journal={CoRR},
  year={2019},
  volume={abs/1902.06148}
}

bigearthnet/rgb (configuration par défaut)

  • Description de la configuration : Canaux Sentinel-2 RVB

  • Taille du jeu de données : 14.07 GiB

  • Structure des fonctionnalités :

FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(120, 120, 3), dtype=uint8),
    'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=43)),
    'metadata': FeaturesDict({
        'acquisition_date': Text(shape=(), dtype=string),
        'coordinates': FeaturesDict({
            'lrx': int64,
            'lry': int64,
            'ulx': int64,
            'uly': int64,
        }),
        'projection': Text(shape=(), dtype=string),
        'tile_source': Text(shape=(), dtype=string),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
nom de fichier Texte chaîne de caractères
image Image (120, 120, 3) uint8
Étiquettes Séquence(ClassLabel) (Aucun,) int64
métadonnées FonctionnalitésDict
metadata/acquisition_date Texte chaîne de caractères
métadonnées/coordonnées FonctionnalitésDict
métadonnées/coordonnées/lrx Tenseur int64
métadonnées/coordonnées/lry Tenseur int64
métadonnées/coordonnées/ulx Tenseur int64
métadonnées/coordonnées/uly Tenseur int64
métadonnées/projection Texte chaîne de caractères
métadonnées/tuile_source Texte chaîne de caractères

Visualisation

bigearthnet/tous

  • Description de la configuration : 13 canaux Sentinel-2

  • Taille du jeu de données : 176.63 GiB

  • Structure des fonctionnalités :

FeaturesDict({
    'B01': Tensor(shape=(20, 20), dtype=float32),
    'B02': Tensor(shape=(120, 120), dtype=float32),
    'B03': Tensor(shape=(120, 120), dtype=float32),
    'B04': Tensor(shape=(120, 120), dtype=float32),
    'B05': Tensor(shape=(60, 60), dtype=float32),
    'B06': Tensor(shape=(60, 60), dtype=float32),
    'B07': Tensor(shape=(60, 60), dtype=float32),
    'B08': Tensor(shape=(120, 120), dtype=float32),
    'B09': Tensor(shape=(20, 20), dtype=float32),
    'B11': Tensor(shape=(60, 60), dtype=float32),
    'B12': Tensor(shape=(60, 60), dtype=float32),
    'B8A': Tensor(shape=(60, 60), dtype=float32),
    'filename': Text(shape=(), dtype=string),
    'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=43)),
    'metadata': FeaturesDict({
        'acquisition_date': Text(shape=(), dtype=string),
        'coordinates': FeaturesDict({
            'lrx': int64,
            'lry': int64,
            'ulx': int64,
            'uly': int64,
        }),
        'projection': Text(shape=(), dtype=string),
        'tile_source': Text(shape=(), dtype=string),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
B01 Tenseur (20, 20) float32
B02 Tenseur (120, 120) float32
B03 Tenseur (120, 120) float32
B04 Tenseur (120, 120) float32
B05 Tenseur (60, 60) float32
B06 Tenseur (60, 60) float32
B07 Tenseur (60, 60) float32
B08 Tenseur (120, 120) float32
B09 Tenseur (20, 20) float32
B11 Tenseur (60, 60) float32
B12 Tenseur (60, 60) float32
B8A Tenseur (60, 60) float32
nom de fichier Texte chaîne de caractères
Étiquettes Séquence(ClassLabel) (Aucun,) int64
métadonnées FonctionnalitésDict
metadata/acquisition_date Texte chaîne de caractères
métadonnées/coordonnées FonctionnalitésDict
métadonnées/coordonnées/lrx Tenseur int64
métadonnées/coordonnées/lry Tenseur int64
métadonnées/coordonnées/ulx Tenseur int64
métadonnées/coordonnées/uly Tenseur int64
métadonnées/projection Texte chaîne de caractères
métadonnées/tuile_source Texte chaîne de caractères