ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

imagenet2012_subset

Imagenet2012Subset เป็นชุดย่อยของชุดข้อมูล ImageNet ILSVRC 2012 ดั้งเดิม ส่วนแบ่งชุดข้อมูลชุดตรวจสอบเหมือนเดิม ImageNet ILSVRC 2,012 ชุด อย่างไรก็ตาม ชุดฝึกอบรมนั้นมีการสุ่มตัวอย่างย่อยในรูปแบบฉลากที่สมดุล ใน 1pct กำหนดค่า 1% หรือ 12,811 ภาพเป็นตัวอย่างการเรียนส่วนใหญ่จะมีหมายเลขเดียวกันของภาพ (เฉลี่ย 12.8) บางชั้นเรียนแบบสุ่มมี 1 ตัวอย่างมากกว่าคนอื่น ๆ ; และใน 10pct กำหนดค่า ~ 10% หรือ 128,116 เรียนส่วนใหญ่จะมีหมายเลขเดียวกันของภาพ (เฉลี่ย 128) และบางชั้นเรียนแบบสุ่มมี 1 ตัวอย่างมากกว่าคนอื่น ๆ

นี้ควรจะนำมาใช้เป็นมาตรฐานสำหรับการเรียนรู้กึ่งภายใต้การดูแลและได้ถูกนำมาใช้ครั้งแรกในกระดาษ SimCLR ( https://arxiv.org/abs/2002.05709 )

  • โฮมเพจ: http://image-net.org/

  • รหัสที่มา: tfds.image_classification.Imagenet2012Subset

  • รุ่น:

    • 2.0.0 : ป้ายตรวจสอบแก้ไข
    • 2.0.1 : แก้ไขการเข้ารหัส ไม่มีการเปลี่ยนแปลงจากมุมมองของผู้ใช้
    • 3.0.0 : แก้ไข colorization บน ~ 12 ภาพ (CMYK -> RGB) แก้ไขรูปแบบเพื่อความสอดคล้อง (แปลงภาพ png เดียวเป็น Jpeg) รุ่นที่เร็วกว่าการอ่านโดยตรงจากไฟล์เก็บถาวร

    • 4.0.0 : (ไม่ได้เผยแพร่)

    • 5.0.0 (เริ่มต้น): แยก API ใหม่ ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : การทดสอบแยกเพิ่ม

  • คำแนะนำการดาวน์โหลดคู่มือ: ชุดนี้คุณจะต้องดาวน์โหลดข้อมูลแหล่งที่มาของตนเองลงใน download_config.manual_dir (ค่าเริ่มต้น ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir ควรประกอบด้วยสองไฟล์: ILSVRC2012_img_train.tar และ ILSVRC2012_img_val.tar คุณจำเป็นต้องลงทะเบียนใน http://www.image-net.org/download-images เพื่อให้ได้รับลิงค์เพื่อดาวน์โหลดชุดข้อมูล

  • ออโต้แคช ( เอกสาร ): ไม่มี

  • คุณสมบัติ:

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('image', 'label')

  • อ้างอิง:

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย Config: 1pct ของการฝึกอบรมชุด ImageNet ทั้งหมด

  • ขนาดการดาวน์โหลด: 254.22 KiB

  • ขนาดชุด: 7.61 GiB

  • แยก:

แยก ตัวอย่าง
'train' 12,811
'validation' 50,000

การสร้างภาพ

imagenet2012_subset/10pct

  • คำอธิบาย Config: 10pct ของการฝึกอบรมชุด ImageNet ทั้งหมด

  • ขนาดการดาวน์โหลด: 2.48 MiB

  • ขนาดชุด: 19.91 GiB

  • แยก:

แยก ตัวอย่าง
'train' 128,116
'validation' 50,000

การสร้างภาพ