chim cánh cụt

  • Mô tả :

Các phép đo đối với ba loài chim cánh cụt được quan sát ở Quần đảo Palmer, Nam Cực.

Những dữ liệu này được Tiến sĩ Kristen Gorman thu thập từ năm 2007 - 2009 với Chương trình Nghiên cứu Sinh thái Dài hạn Trạm Palmer , một phần của Mạng lưới Nghiên cứu Sinh thái Dài hạn của Hoa Kỳ. Dữ liệu ban đầu được nhập từ Cổng dữ liệu Sáng kiến ​​dữ liệu môi trường (EDI) và có sẵn để sử dụng theo giấy phép CC0 ("Không bảo lưu quyền") theo Chính sách dữ liệu của Trạm Palmer. Bản sao này được nhập từ kho lưu trữ GitHub của Allison Horst .

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

chim cánh cụt/đã xử lý (cấu hình mặc định)

  • Mô tả cấu hình : penguins/processed là sự thay thế tùy chọn cho tập dữ liệu iris . Nó chứa 4 tính năng số được chuẩn hóa được trình bày dưới dạng một tenxơ duy nhất, không có giá trị nào bị thiếu và nhãn lớp (loài) được trình bày dưới dạng số nguyên (n = 334).

  • Kích thước tải xuống : 25.05 KiB

  • Kích thước tập dữ liệu : 17.61 KiB

  • Chia tách :

Tách ra ví dụ
'train' 334
  • Cấu trúc tính năng :
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=float32),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
Tính năng, đặc điểm tenxơ (4,) phao32
loài LớpNhãn int64

chim cánh cụt / đơn giản

  • Mô tả cấu hình : penguins/simple đã được xử lý từ tập dữ liệu thô, với các nhãn lớp được đơn giản hóa bắt nguồn từ các trường văn bản, thiếu các giá trị được đánh dấu là NaN/NA và chỉ giữ lại 7 tính năng quan trọng (n = 344).

  • Kích thước tải xuống : 13.20 KiB

  • Kích thước tập dữ liệu : 56.10 KiB

  • Chia tách :

Tách ra ví dụ
'train' 344
  • Cấu trúc tính năng :
FeaturesDict({
    'body_mass_g': float32,
    'culmen_depth_mm': float32,
    'culmen_length_mm': float32,
    'flipper_length_mm': float32,
    'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
body_mass_g tenxơ phao32
culmen_deep_mm tenxơ phao32
culmen_length_mm tenxơ phao32
flipper_length_mm tenxơ phao32
Đảo LớpNhãn int64
tình dục LớpNhãn int64
loài LớpNhãn int64
  • Các khóa được giám sát (Xem as_supervised doc ): ({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')

  • Ví dụ ( tfds.as_dataframe ):

chim cánh cụt / sống

  • Mô tả cấu hình : penguins/raw là bản sao gốc, chưa qua xử lý từ @allisonhorst, chứa tất cả 17 tính năng, được trình bày dưới dạng kiểu số hoặc dưới dạng văn bản thô (n = 344).

  • Kích thước tải xuống : 49.72 KiB

  • Kích thước tập dữ liệu : 164.51 KiB

  • Chia tách :

Tách ra ví dụ
'train' 344
  • Cấu trúc tính năng :
FeaturesDict({
    'Body Mass (g)': float32,
    'Clutch Completion': Text(shape=(), dtype=string),
    'Comments': Text(shape=(), dtype=string),
    'Culmen Depth (mm)': float32,
    'Culmen Length (mm)': float32,
    'Date Egg': Text(shape=(), dtype=string),
    'Delta 13 C (o/oo)': float32,
    'Delta 15 N (o/oo)': float32,
    'Flipper Length (mm)': float32,
    'Individual ID': Text(shape=(), dtype=string),
    'Island': Text(shape=(), dtype=string),
    'Region': Text(shape=(), dtype=string),
    'Sample Number': int32,
    'Sex': Text(shape=(), dtype=string),
    'Species': Text(shape=(), dtype=string),
    'Stage': Text(shape=(), dtype=string),
    'studyName': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
Khối lượng cơ thể (g) tenxơ phao32
Hoàn thành ly hợp Chữ sợi dây
Bình luận Chữ sợi dây
Độ sâu cống (mm) tenxơ phao32
Chiều dài cống (mm) tenxơ phao32
trứng chà là Chữ sợi dây
Đồng bằng 13 C (o/oo) tenxơ phao32
Đồng bằng 15 N (o/oo) tenxơ phao32
Chiều dài chân chèo (mm) tenxơ phao32
ID cá nhân Chữ sợi dây
Hòn đảo Chữ sợi dây
Vùng đất Chữ sợi dây
Số mẫu tenxơ int32
giới tính Chữ sợi dây
Loài Chữ sợi dây
Sân khấu Chữ sợi dây
tên học Chữ sợi dây