Ajuda a proteger a Grande Barreira de Corais com TensorFlow em Kaggle Junte Desafio

pinguins

  • Descrição:

Medições para três espécies de pinguins observadas no arquipélago Palmer, Antártica.

Estes dados foram coletados a partir de 2007 - 2009 pelo Dr. Kristen Gorman com a Longo Prazo do Programa de Pesquisas Ecológicas Estação Palmer , que faz parte da US Long Term Ecological Research Network . Os dados foram inicialmente importados da Iniciativa de Dados Ambientais (EDI) Portal de Dados, e estão disponíveis para uso por licença CC0 ( "Não há direitos reservados"), em conformidade com a Política de Dados Estação Palmer. Esta cópia foi importado do repositório GitHub de Allison Horst .

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

pinguins / processados ​​(configuração padrão)

  • Configuração Descrição: penguins/processed é um substituto para a iris conjunto de dados. Ele contém 4 recursos numéricos normalizados apresentados como um único tensor, sem valores ausentes e o rótulo da classe (espécie) é apresentado como um inteiro (n = 334).

  • Tamanho do download: 25.05 KiB

  • Dataset tamanho: 17.61 KiB

  • desdobramentos:

Dividir Exemplos
'train' 334
  • Características:
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=tf.float32),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})

pinguins / simples

  • Configuração Descrição: penguins/simple foi obtido a partir do conjunto de dados em bruto, com etiquetas de classe simplificados derivados de campos de texto, os valores assinalados como NaN / NA ausente e retém apenas sete características significativas (n = 344).

  • Tamanho do download: 13.20 KiB

  • Dataset tamanho: 56.10 KiB

  • desdobramentos:

Dividir Exemplos
'train' 344
  • Características:
FeaturesDict({
    'body_mass_g': tf.float32,
    'culmen_depth_mm': tf.float32,
    'culmen_length_mm': tf.float32,
    'flipper_length_mm': tf.float32,
    'island': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})
  • Chaves supervisionado (Veja as_supervised doc ): ({'flipper_length_mm': 'flipper_length_mm', 'species': 'species', 'culmen_length_mm': 'culmen_length_mm', 'sex': 'sex', 'culmen_depth_mm': 'culmen_depth_mm', 'island': 'island', 'body_mass_g': 'body_mass_g'}, 'species')

  • Exemplos ( tfds.as_dataframe ):

pinguins / cru

  • Configuração Descrição: penguins/raw é o original, da cópia não processado de @allisonhorst, contendo todos os 17 características, apresentados como tipos numéricos ou como texto em bruto (n = 344).

  • Tamanho do download: 49.72 KiB

  • Dataset size: 164.51 KiB

  • desdobramentos:

Dividir Exemplos
'train' 344
  • Características:
FeaturesDict({
    'Body Mass (g)': tf.float32,
    'Clutch Completion': Text(shape=(), dtype=tf.string),
    'Comments': Text(shape=(), dtype=tf.string),
    'Culmen Depth (mm)': tf.float32,
    'Culmen Length (mm)': tf.float32,
    'Date Egg': Text(shape=(), dtype=tf.string),
    'Delta 13 C (o/oo)': tf.float32,
    'Delta 15 N (o/oo)': tf.float32,
    'Flipper Length (mm)': tf.float32,
    'Individual ID': Text(shape=(), dtype=tf.string),
    'Island': Text(shape=(), dtype=tf.string),
    'Region': Text(shape=(), dtype=tf.string),
    'Sample Number': tf.int32,
    'Sex': Text(shape=(), dtype=tf.string),
    'Species': Text(shape=(), dtype=tf.string),
    'Stage': Text(shape=(), dtype=tf.string),
    'studyName': Text(shape=(), dtype=tf.string),
})