Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

пингвины

  • Описание :

Измерения трех видов пингвинов, наблюдаемые на архипелаге Палмера в Антарктиде.

Эти данные были собраны в 2007-2009 годах доктором Кристен Горман в рамках Программы долгосрочных экологических исследований станции Палмер , входящей в Сеть долгосрочных экологических исследований США . Данные были первоначально импортированы с портала данных инициативы по экологическим данным (EDI) и доступны для использования по лицензии CC0 («Права не защищены») в соответствии с политикой данных Palmer Station. Эта копия была импортирована из репозитория Эллисон Хорст на GitHub .

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

пингвины/обработано (конфиг по умолчанию)

  • Описание конфигурации : penguins/processed — это замена набора данных iris . Он содержит 4 нормализованных числовых признака, представленных в виде одного тензора, без пропущенных значений, а метка класса (вид) представлена ​​в виде целого числа (n = 334).

  • Размер загрузки : 25.05 KiB

  • Размер набора данных : 17.61 KiB .

  • Сплиты :

Расколоть Примеры
'train' 334
  • Особенности :
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=tf.float32),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})

пингвины/простой

  • Описание конфигурации : penguins/simple были обработаны из необработанного набора данных с упрощенными метками классов, полученными из текстовых полей, отсутствующие значения помечены как NaN/NA и сохранены только 7 важных функций (n = 344).

  • Размер загрузки : 13.20 KiB

  • Размер набора данных : 56.10 KiB

  • Сплиты :

Расколоть Примеры
'train' 344
  • Особенности :
FeaturesDict({
    'body_mass_g': tf.float32,
    'culmen_depth_mm': tf.float32,
    'culmen_length_mm': tf.float32,
    'flipper_length_mm': tf.float32,
    'island': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})
  • Контролируемые ключи (см. as_supervised doc ): ({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')

  • Примеры ( tfds.as_dataframe ):

пингвины/сырые

  • Описание конфига: penguins/raw — оригинальная, необработанная копия от @allisonhorst, содержащая все 17 функций, представленных либо в виде числовых типов, либо в виде необработанного текста (n = 344).

  • Размер загрузки : 49.72 KiB

  • Размер набора данных : 164.51 KiB .

  • Сплиты :

Расколоть Примеры
'train' 344
  • Особенности :
FeaturesDict({
    'Body Mass (g)': tf.float32,
    'Clutch Completion': Text(shape=(), dtype=tf.string),
    'Comments': Text(shape=(), dtype=tf.string),
    'Culmen Depth (mm)': tf.float32,
    'Culmen Length (mm)': tf.float32,
    'Date Egg': Text(shape=(), dtype=tf.string),
    'Delta 13 C (o/oo)': tf.float32,
    'Delta 15 N (o/oo)': tf.float32,
    'Flipper Length (mm)': tf.float32,
    'Individual ID': Text(shape=(), dtype=tf.string),
    'Island': Text(shape=(), dtype=tf.string),
    'Region': Text(shape=(), dtype=tf.string),
    'Sample Number': tf.int32,
    'Sex': Text(shape=(), dtype=tf.string),
    'Species': Text(shape=(), dtype=tf.string),
    'Stage': Text(shape=(), dtype=tf.string),
    'studyName': Text(shape=(), dtype=tf.string),
})