imagenet2012_subset

Imagenet2012Subset เป็นชุดย่อยของชุดข้อมูล ImageNet ILSVRC 2012 ดั้งเดิม ชุดข้อมูลใช้ชุดการตรวจสอบ เดียวกัน กับชุดข้อมูล ImageNet ILSVRC 2012 ดั้งเดิม อย่างไรก็ตาม ชุดการฝึกจะถูกสุ่มตัวอย่างย่อยตามรูปแบบที่สมดุล ในการกำหนดค่า 1pct , 1% หรือ 12811 รูปภาพจะถูกสุ่มตัวอย่าง คลาสส่วนใหญ่มีจำนวนรูปภาพเท่ากัน (เฉลี่ย 12.8) บางคลาสสุ่มมีตัวอย่างมากกว่า 1 ตัวอย่าง; และในการกำหนดค่า 10pct , ~10% หรือ 128116 คลาสส่วนใหญ่มีจำนวนรูปภาพเท่ากัน (เฉลี่ย 128 รูป) และบางคลาสสุ่มมีตัวอย่างมากกว่า 1 ตัวอย่างแบบสุ่ม

สิ่งนี้ควรจะใช้เป็นเกณฑ์มาตรฐานสำหรับการเรียนรู้แบบกึ่งมีผู้สอน และเดิมใช้ในเอกสาร SimCLR ( https://arxiv.org/abs/2002.05709 )

  • หน้าแรก : http://image-net.org/

  • รหัสที่มา : tfds.datasets.imagenet2012_subset.Builder

  • รุ่น :

    • 2.0.0 : แก้ไขป้ายกำกับการตรวจสอบความถูกต้อง
    • 2.0.1 : แก้ไขการเข้ารหัส ไม่มีการเปลี่ยนแปลงจากมุมมองของผู้ใช้
    • 3.0.0 : แก้ไข colorization บน ~12 ภาพ (CMYK -> RGB) แก้ไขรูปแบบเพื่อความสอดคล้องกัน (แปลงภาพ png เดียวเป็น Jpeg) รุ่นที่เร็วกว่าการอ่านโดยตรงจากไฟล์เก็บถาวร

    • 4.0.0 : (ยังไม่ได้เผยแพร่)

    • 5.0.0 (ค่าเริ่มต้น): API แยกใหม่ ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : เพิ่มการแบ่งการทดสอบ

  • คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน download_config.manual_dir (ค่าเริ่มต้นเป็น ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir ควรมีสองไฟล์: ILSVRC2012_img_train.tar และ ILSVRC2012_img_val.tar คุณต้องลงทะเบียนบน https://image-net.org/download-images เพื่อรับลิงก์สำหรับดาวน์โหลดชุดข้อมูล

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • โครงสร้างคุณลักษณะ :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ชื่อไฟล์ ข้อความ สตริง
ภาพ ภาพ (ไม่มี, ไม่มี, 3) uint8
ฉลาก ป้ายกำกับคลาส int64
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('image', 'label')

  • การอ้างอิง :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (การกำหนดค่าเริ่มต้น)

  • คำอธิบายการกำหนดค่า : 1% ของชุดการฝึก ImageNet ทั้งหมด

  • ขนาดการดาวน์โหลด : 254.22 KiB

  • ขนาดชุดข้อมูล : 7.61 GiB

  • แยก :

แยก ตัวอย่าง
'train' 12,811
'validation' 50,000

การสร้างภาพ

imagenet2012_subset/10pct

  • คำอธิบายการกำหนดค่า : 10% ของชุดการฝึก ImageNet ทั้งหมด

  • ขนาดการดาวน์โหลด : 2.48 MiB

  • ขนาดชุดข้อมูล : 19.91 GiB

  • แยก :

แยก ตัวอย่าง
'train' 128,116
'validation' 50,000

การสร้างภาพ