ขอขอบคุณที่เข้าร่วม Google I/O ดูเซสชั่นทั้งหมดตามความต้องการ ดูตามความต้องการ

caltech101

  • คำอธิบาย :

Caltech-101 ประกอบด้วยรูปภาพของวัตถุที่อยู่ในคลาส 101 คลาส และคลาสที่ background clutter หนึ่งคลาส ภาพแต่ละภาพมีป้ายกำกับด้วยวัตถุเดียว แต่ละคลาสมีรูปภาพประมาณ 40 ถึง 800 รูป รวมทั้งหมดประมาณ 9,000 รูป รูปภาพมีขนาดต่างๆ กัน โดยมีความยาวขอบโดยทั่วไปที่ 200-300 พิกเซล รุ่นนี้มีป้ายกำกับระดับรูปภาพเท่านั้น ชุดข้อมูลดั้งเดิมยังมีกล่องที่มีขอบเขต

แยก ตัวอย่าง
'test' 6,084
'train' 3,060
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=102),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (ไม่มี, ไม่มี, 3) uint8
รูปภาพ/file_name ข้อความ สตริง
ฉลาก ป้ายกำกับคลาส int64

การสร้างภาพ

  • การอ้างอิง :
@article{FeiFei2004LearningGV,
  title={Learning Generative Visual Models from Few Training Examples: An Incremental Bayesian Approach Tested on 101 Object Categories},
  author={Li Fei-Fei and Rob Fergus and Pietro Perona},
  journal={Computer Vision and Pattern Recognition Workshop},
  year={2004},
}