การสร้างภาพ : สำรวจใน Know Your Data
คำอธิบาย :
Imagenet2012Subset เป็นชุดย่อยของชุดข้อมูล ImageNet ILSVRC 2012 ดั้งเดิม ชุดข้อมูลใช้ชุดการตรวจสอบ เดียวกัน กับชุดข้อมูล ImageNet ILSVRC 2012 ดั้งเดิม อย่างไรก็ตาม ชุดการฝึกจะถูกสุ่มตัวอย่างย่อยตามรูปแบบที่สมดุล ในการกำหนดค่า 1pct
, 1% หรือ 12811 รูปภาพจะถูกสุ่มตัวอย่าง คลาสส่วนใหญ่มีจำนวนรูปภาพเท่ากัน (เฉลี่ย 12.8) บางคลาสสุ่มมีตัวอย่างมากกว่า 1 ตัวอย่าง; และในการกำหนดค่า 10pct
, ~10% หรือ 128116 คลาสส่วนใหญ่มีจำนวนรูปภาพเท่ากัน (เฉลี่ย 128 รูป) และบางคลาสสุ่มมีตัวอย่างมากกว่า 1 ตัวอย่างแบบสุ่ม
สิ่งนี้ควรจะใช้เป็นเกณฑ์มาตรฐานสำหรับการเรียนรู้แบบกึ่งมีผู้สอน และเดิมใช้ในเอกสาร SimCLR ( https://arxiv.org/abs/2002.05709 )
หน้าแรก : http://image-net.org/
รหัสที่มา :
tfds.datasets.imagenet2012_subset.Builder
รุ่น :
-
2.0.0
: แก้ไขป้ายกำกับการตรวจสอบความถูกต้อง -
2.0.1
: แก้ไขการเข้ารหัส ไม่มีการเปลี่ยนแปลงจากมุมมองของผู้ใช้ 3.0.0
: แก้ไข colorization บน ~12 ภาพ (CMYK -> RGB) แก้ไขรูปแบบเพื่อความสอดคล้องกัน (แปลงภาพ png เดียวเป็น Jpeg) รุ่นที่เร็วกว่าการอ่านโดยตรงจากไฟล์เก็บถาวร4.0.0
: (ยังไม่ได้เผยแพร่)5.0.0
(ค่าเริ่มต้น): API แยกใหม่ ( https://tensorflow.org/datasets/splits )5.1.0
: เพิ่มการแบ่งการทดสอบ
-
คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน
download_config.manual_dir
(ค่าเริ่มต้นเป็น~/tensorflow_datasets/downloads/manual/
):
manual_dir ควรมีสองไฟล์: ILSVRC2012_img_train.tar และ ILSVRC2012_img_val.tar คุณต้องลงทะเบียนบน https://image-net.org/download-images เพื่อรับลิงก์สำหรับดาวน์โหลดชุดข้อมูลแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
โครงสร้างคุณลักษณะ :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ชื่อไฟล์ | ข้อความ | สตริง | ||
ภาพ | ภาพ | (ไม่มี, ไม่มี, 3) | uint8 | |
ฉลาก | ป้ายกำกับคลาส | int64 |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('image', 'label')
การอ้างอิง :
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (การกำหนดค่าเริ่มต้น)
คำอธิบายการกำหนดค่า : 1% ของชุดการฝึก ImageNet ทั้งหมด
ขนาดการดาวน์โหลด :
254.22 KiB
ขนาดชุดข้อมูล :
7.61 GiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 12,811 |
'validation' | 50,000 |
- รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):
imagenet2012_subset/10pct
คำอธิบายการกำหนดค่า : 10% ของชุดการฝึก ImageNet ทั้งหมด
ขนาดการดาวน์โหลด :
2.48 MiB
ขนาดชุดข้อมูล :
19.91 GiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 128,116 |
'validation' | 50,000 |
- รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):