펭귄

  • 설명 :

남극 팔머 군도에서 관찰된 3종의 펭귄에 대한 측정.

이 데이터는 미국 장기 생태 연구 네트워크 의 일부인 Palmer Station 장기 생태 연구 프로그램 의 Kristen Gorman 박사가 2007-2009년에 수집한 것입니다. 데이터는 원래 EDI( Environmental Data Initiative ) 데이터 포털에서 가져왔으며 Palmer Station 데이터 정책에 따라 CC0 라이선스("권한 없음")로 사용할 수 있습니다. 이 사본은 Allison Horst의 GitHub 저장소 에서 가져왔습니다.

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

펭귄/처리됨(기본 구성)

  • 구성 설명 : penguins/processediris 데이터 세트를 즉시 대체합니다. 여기에는 단일 텐서로 표시되는 4개의 정규화된 수치 기능이 포함되어 있으며 누락된 값이 없으며 클래스 레이블(종)은 정수(n = 334)로 표시됩니다.

  • 다운로드 크기 : 25.05 KiB

  • 데이터 세트 크기 : 17.61 KiB

  • 분할 :

나뉘다
'train' 334
  • 기능 구조 :
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=float32),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
특징 텐서 (4,) float32
클래스 레이블 int64

펭귄/단순

  • 구성 설명 : penguins/simple 은 원시 데이터 세트에서 처리되었으며, 텍스트 필드에서 파생된 단순화된 클래스 레이블, NaN/NA로 표시된 누락된 값 및 7개의 중요한 기능(n = 344)만 유지합니다.

  • 다운로드 크기 : 13.20 KiB

  • 데이터 세트 크기 : 56.10 KiB

  • 분할 :

나뉘다
'train' 344
  • 기능 구조 :
FeaturesDict({
    'body_mass_g': float32,
    'culmen_depth_mm': float32,
    'culmen_length_mm': float32,
    'flipper_length_mm': float32,
    'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
body_mass_g 텐서 float32
culmen_depth_mm 텐서 float32
culmen_length_mm 텐서 float32
플리퍼_길이_mm 텐서 float32
클래스 레이블 int64
섹스 클래스 레이블 int64
클래스 레이블 int64
  • 감독 키 ( as_supervised 문서 참조): ({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')

  • ( tfds.as_dataframe ):

펭귄/생

  • 구성 설명 : penguins/raw 는 @allisonhorst의 처리되지 않은 원본 사본으로 17가지 기능을 모두 포함하며 숫자 유형 또는 원시 텍스트(n = 344)로 표시됩니다.

  • 다운로드 크기 : 49.72 KiB

  • 데이터 세트 크기 : 164.51 KiB

  • 분할 :

나뉘다
'train' 344
  • 기능 구조 :
FeaturesDict({
    'Body Mass (g)': float32,
    'Clutch Completion': Text(shape=(), dtype=string),
    'Comments': Text(shape=(), dtype=string),
    'Culmen Depth (mm)': float32,
    'Culmen Length (mm)': float32,
    'Date Egg': Text(shape=(), dtype=string),
    'Delta 13 C (o/oo)': float32,
    'Delta 15 N (o/oo)': float32,
    'Flipper Length (mm)': float32,
    'Individual ID': Text(shape=(), dtype=string),
    'Island': Text(shape=(), dtype=string),
    'Region': Text(shape=(), dtype=string),
    'Sample Number': int32,
    'Sex': Text(shape=(), dtype=string),
    'Species': Text(shape=(), dtype=string),
    'Stage': Text(shape=(), dtype=string),
    'studyName': Text(shape=(), dtype=string),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
체질량(g) 텐서 float32
클러치 완성 텍스트
코멘트 텍스트
컬멘 깊이(mm) 텐서 float32
줄기 길이(mm) 텐서 float32
데이트 에그 텍스트
델타 13C(o/oo) 텐서 float32
델타 15N(o/oo) 텐서 float32
플리퍼 길이(mm) 텐서 float32
개인 아이디 텍스트
텍스트
지역 텍스트
샘플 번호 텐서 int32
섹스 텍스트
텍스트
단계 텍스트
연구 이름 텍스트