pingouins

  • Descriptif :

Mesures pour trois espèces de manchots observées dans l'archipel Palmer, en Antarctique.

Ces données ont été recueillies de 2007 à 2009 par le Dr Kristen Gorman du Palmer Station Long Term Ecological Research Program , qui fait partie du US Long Term Ecological Research Network . Les données ont été importées à l'origine du portail de données de l' Environmental Data Initiative (EDI) et sont disponibles pour une utilisation sous licence CC0 ("Aucun droit réservé") conformément à la politique de données de Palmer Station. Cette copie a été importée du référentiel GitHub d'Allison Horst .

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

pingouins/traités (config par défaut)

  • Description de la configuration : penguins/processed est un remplacement direct du jeu de données iris . Il contient 4 caractéristiques numériques normalisées présentées sous la forme d'un seul tenseur, aucune valeur manquante et l'étiquette de classe (espèce) est présentée sous la forme d'un nombre entier (n = 334).

  • Taille du téléchargement : 25.05 KiB

  • Taille du jeu de données : 17.61 KiB

  • Fractionnements :

Diviser Exemples
'train' 334
  • Structure des fonctionnalités :
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=float32),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
Caractéristiques Tenseur (4,) float32
espèces Étiquette de classe int64

pingouins/simples

  • Description de la configuration : penguins/simple a été traité à partir de l'ensemble de données brutes, avec des étiquettes de classe simplifiées dérivées des champs de texte, des valeurs manquantes marquées comme NaN/NA et ne conserve que 7 caractéristiques significatives (n = 344).

  • Taille du téléchargement : 13.20 KiB

  • Taille du jeu de données : 56.10 KiB

  • Fractionnements :

Diviser Exemples
'train' 344
  • Structure des fonctionnalités :
FeaturesDict({
    'body_mass_g': float32,
    'culmen_depth_mm': float32,
    'culmen_length_mm': float32,
    'flipper_length_mm': float32,
    'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
masse_corps_g Tenseur float32
culmen_depth_mm Tenseur float32
culmen_length_mm Tenseur float32
flipper_length_mm Tenseur float32
île Étiquette de classe int64
sexe Étiquette de classe int64
espèces Étiquette de classe int64
  • Clés supervisées (Voir as_supervised doc ): ({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')

  • Exemples ( tfds.as_dataframe ):

pingouins/cru

  • Description de la configuration : penguins/raw est la copie originale non traitée de @allisonhorst, contenant les 17 fonctionnalités, présentées soit sous forme de types numériques, soit sous forme de texte brut (n = 344).

  • Taille du téléchargement : 49.72 KiB

  • Taille du jeu de données : 164.51 KiB

  • Fractionnements :

Diviser Exemples
'train' 344
  • Structure des fonctionnalités :
FeaturesDict({
    'Body Mass (g)': float32,
    'Clutch Completion': Text(shape=(), dtype=string),
    'Comments': Text(shape=(), dtype=string),
    'Culmen Depth (mm)': float32,
    'Culmen Length (mm)': float32,
    'Date Egg': Text(shape=(), dtype=string),
    'Delta 13 C (o/oo)': float32,
    'Delta 15 N (o/oo)': float32,
    'Flipper Length (mm)': float32,
    'Individual ID': Text(shape=(), dtype=string),
    'Island': Text(shape=(), dtype=string),
    'Region': Text(shape=(), dtype=string),
    'Sample Number': int32,
    'Sex': Text(shape=(), dtype=string),
    'Species': Text(shape=(), dtype=string),
    'Stage': Text(shape=(), dtype=string),
    'studyName': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
Masse corporelle (g) Tenseur float32
Achèvement de l'embrayage Texte chaîne de caractères
commentaires Texte chaîne de caractères
Profondeur du culmen (mm) Tenseur float32
Longueur du culmen (mm) Tenseur float32
Datte Oeuf Texte chaîne de caractères
Delta 13 C (o/oo) Tenseur float32
Delta 15 N (o/oo) Tenseur float32
Longueur de batteur (mm) Tenseur float32
ID individuel Texte chaîne de caractères
Île Texte chaîne de caractères
Région Texte chaîne de caractères
Numéro d'échantillon Tenseur int32
Sexe Texte chaîne de caractères
Espèces Texte chaîne de caractères
Organiser Texte chaîne de caractères
Nom de l'étude Texte chaîne de caractères