Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

pingüinos

  • Descripción:

Mediciones para tres especies de pingüinos observadas en el archipiélago de Palmer, Antártida.

Estos datos se obtuvieron de de 2007 - 2009 por el Dr. Kristen Gorman con el Programa de Investigación de la Estación Palmer ecológico a largo plazo , que forma parte de la Red de Investigación Ecológica a Largo Plazo de Estados Unidos . Los datos fueron importados originalmente de la Iniciativa Ambiental de datos (EDI) Portal de datos, y están disponibles para su uso por la licencia A0 ( "ningún derecho reservado") de acuerdo con la Política de datos Estación Palmer. Esta copia fue importada desde repositorio GitHub de Allison Horst .

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

pingüinos / procesados ​​(configuración predeterminada)

  • Descripción Config: penguins/processed es una gota en el reemplazo para el iris conjunto de datos. Contiene 4 características numéricas normalizadas presentadas como un solo tensor, sin valores perdidos y la etiqueta de clase (especie) se presenta como un número entero (n = 334).

  • Tamaño del paquete: 25.05 KiB

  • Conjunto de datos de tamaño: 17.61 KiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 334
  • características:
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=tf.float32),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})

pingüinos / simple

  • Descripción Config: penguins/simple ha sido procesado del conjunto de datos en bruto, con etiquetas de clase simplificados derivados de campos de texto, los valores marcados como NaN / NA falta y retiene sólo 7 características significativas (n = 344).

  • Tamaño del paquete: 13.20 KiB

  • Conjunto de datos de tamaño: 56.10 KiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 344
  • características:
FeaturesDict({
    'body_mass_g': tf.float32,
    'culmen_depth_mm': tf.float32,
    'culmen_length_mm': tf.float32,
    'flipper_length_mm': tf.float32,
    'island': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})
  • Claves supervisadas (Ver as_supervised doc ): ({'island': 'island', 'species': 'species', 'flipper_length_mm': 'flipper_length_mm', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'sex': 'sex', 'body_mass_g': 'body_mass_g'}, 'species')

  • Ejemplos ( tfds.as_dataframe ):

pingüinos / crudo

  • Descripción Config: penguins/raw es el original, copia sin procesar de @allisonhorst, que contiene todas las 17 características, presentado ya sea como tipos numéricos o como texto en bruto (n = 344).

  • Tamaño del paquete: 49.72 KiB

  • Conjunto de datos de tamaño: 164.51 KiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 344
  • características:
FeaturesDict({
    'Body Mass (g)': tf.float32,
    'Clutch Completion': Text(shape=(), dtype=tf.string),
    'Comments': Text(shape=(), dtype=tf.string),
    'Culmen Depth (mm)': tf.float32,
    'Culmen Length (mm)': tf.float32,
    'Date Egg': Text(shape=(), dtype=tf.string),
    'Delta 13 C (o/oo)': tf.float32,
    'Delta 15 N (o/oo)': tf.float32,
    'Flipper Length (mm)': tf.float32,
    'Individual ID': Text(shape=(), dtype=tf.string),
    'Island': Text(shape=(), dtype=tf.string),
    'Region': Text(shape=(), dtype=tf.string),
    'Sample Number': tf.int32,
    'Sex': Text(shape=(), dtype=tf.string),
    'Species': Text(shape=(), dtype=tf.string),
    'Stage': Text(shape=(), dtype=tf.string),
    'studyName': Text(shape=(), dtype=tf.string),
})