pinguins

  • Descrição :

Medições para três espécies de pinguins observadas no Arquipélago Palmer, Antártica.

Esses dados foram coletados de 2007-2009 pela Dra. Kristen Gorman com o Programa de Pesquisa Ecológica de Longo Prazo da Estação Palmer , parte da Rede de Pesquisa Ecológica de Longo Prazo dos EUA . Os dados foram originalmente importados do Portal de Dados da Iniciativa de Dados Ambientais (EDI) e estão disponíveis para uso pela licença CC0 ("Sem Direitos Reservados") de acordo com a Política de Dados da Palmer Station. Esta cópia foi importada do repositório GitHub de Allison Horst .

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

pinguins/processado (configuração padrão)

  • Descrição da configuração : penguins/processed é um substituto para o conjunto de dados da iris . Ele contém 4 recursos numéricos normalizados apresentados como um único tensor, sem valores ausentes e o rótulo da classe (espécie) é apresentado como um número inteiro (n = 334).

  • Tamanho do download : 25.05 KiB

  • Tamanho do conjunto de dados : 17.61 KiB

  • Divisões :

Dividir Exemplos
'train' 334
  • Estrutura de recursos :
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=float32),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
recursos tensor (4,) float32
espécies ClassLabel int64

pinguins/simples

  • Descrição da configuração : penguins/simple foi processado a partir do conjunto de dados brutos, com rótulos de classe simplificados derivados de campos de texto, valores ausentes marcados como NaN/NA e retém apenas 7 recursos significativos (n = 344).

  • Tamanho do download : 13.20 KiB

  • Tamanho do conjunto de dados : 56.10 KiB

  • Divisões :

Dividir Exemplos
'train' 344
  • Estrutura de recursos :
FeaturesDict({
    'body_mass_g': float32,
    'culmen_depth_mm': float32,
    'culmen_length_mm': float32,
    'flipper_length_mm': float32,
    'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
body_mass_g tensor float32
culmen_depth_mm tensor float32
culmen_length_mm tensor float32
flipper_length_mm tensor float32
ilha ClassLabel int64
sexo ClassLabel int64
espécies ClassLabel int64
  • Chaves supervisionadas (Consulte as_supervised doc ): ({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')

  • Exemplos ( tfds.as_dataframe ):

pinguins/cru

  • Descrição da configuração : penguins/raw é a cópia original e não processada de @allisonhorst, contendo todos os 17 recursos, apresentados como tipos numéricos ou como texto bruto (n = 344).

  • Tamanho do download : 49.72 KiB

  • Tamanho do conjunto de dados : 164.51 KiB

  • Divisões :

Dividir Exemplos
'train' 344
  • Estrutura de recursos :
FeaturesDict({
    'Body Mass (g)': float32,
    'Clutch Completion': Text(shape=(), dtype=string),
    'Comments': Text(shape=(), dtype=string),
    'Culmen Depth (mm)': float32,
    'Culmen Length (mm)': float32,
    'Date Egg': Text(shape=(), dtype=string),
    'Delta 13 C (o/oo)': float32,
    'Delta 15 N (o/oo)': float32,
    'Flipper Length (mm)': float32,
    'Individual ID': Text(shape=(), dtype=string),
    'Island': Text(shape=(), dtype=string),
    'Region': Text(shape=(), dtype=string),
    'Sample Number': int32,
    'Sex': Text(shape=(), dtype=string),
    'Species': Text(shape=(), dtype=string),
    'Stage': Text(shape=(), dtype=string),
    'studyName': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
Massa Corporal (g) tensor float32
Conclusão da embreagem Texto fragmento
Comentários Texto fragmento
Profundidade do Culmen (mm) tensor float32
Comprimento do cúlmen (mm) tensor float32
Tâmara Texto fragmento
Delta 13 C (o/oo) tensor float32
Delta 15 N (o/oo) tensor float32
Comprimento da nadadeira (mm) tensor float32
ID individual Texto fragmento
Ilha Texto fragmento
Região Texto fragmento
Número da amostra tensor int32
Sexo Texto fragmento
Espécies Texto fragmento
Etapa Texto fragmento
nome do estudo Texto fragmento