ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

imagenet2012

ILSVRC 2012 หรือที่เรียกกันทั่วไปว่า 'ImageNet' คือชุดข้อมูลรูปภาพที่จัดระเบียบตามลำดับชั้นของ WordNet แต่ละแนวคิดที่มีความหมายใน WordNet ซึ่งอาจอธิบายได้ด้วยคำหรือวลีหลายคำ เรียกว่า "ชุดคำพ้องความหมาย" หรือ "ชุดคำพ้องความหมาย" WordNet มีซินเซ็ตมากกว่า 100,000 รายการ ส่วนใหญ่เป็นคำนาม (80,000+) ใน ImageNet เราตั้งเป้าที่จะให้ภาพโดยเฉลี่ย 1,000 ภาพเพื่อแสดงแต่ละซินเซ็ต รูปภาพของแต่ละแนวคิดมีการควบคุมคุณภาพและมีการอธิบายโดยมนุษย์ เมื่อเสร็จสิ้น เราหวังว่า ImageNet จะนำเสนอภาพที่จัดเรียงอย่างเรียบร้อยนับสิบล้านภาพสำหรับแนวคิดส่วนใหญ่ในลำดับชั้นของ WordNet

การแยกทดสอบมีรูปภาพ 1 แสนภาพ แต่ไม่มีป้ายกำกับ เนื่องจากไม่มีการเผยแพร่ป้ายกำกับต่อสาธารณะ เราให้การสนับสนุนสำหรับการทดสอบแยกจากปี 2012 ด้วยโปรแกรมแก้ไขย่อยที่เผยแพร่เมื่อวันที่ 10 ตุลาคม 2019 ในการดาวน์โหลดข้อมูลนี้ด้วยตนเอง ผู้ใช้ต้องดำเนินการดังต่อไปนี้:

  1. ดาวน์โหลดแยก 2012 การทดสอบที่มีอยู่ ที่นี่
  2. ดาวน์โหลดแพทช์ 10 ตุลาคม 2019 มีลิงก์ Google ไดรฟ์ไปยังโปรแกรมแก้ไขที่ให้ไว้ในหน้าเดียวกัน
  3. รวม tar-ball สองอันเข้าด้วยกัน โดยเขียนทับรูปภาพใดๆ ในไฟล์เก็บถาวรดั้งเดิมด้วยรูปภาพจากแพตช์ ตามคำแนะนำใน image-net.org ขั้นตอนนี้เขียนทับเพียงไม่กี่ภาพ

tar-ball ที่ได้นั้นอาจถูกประมวลผลโดย TFDS

ในการประเมินความแม่นยำของโมเดลบนการทดสอบ ImageNet แยก หนึ่งต้องรันการอนุมานบนอิมเมจทั้งหมดในการแยก ส่งออกผลลัพธ์เหล่านั้นไปยังไฟล์ข้อความที่ต้องอัปโหลดไปยังเซิร์ฟเวอร์การประเมินของ ImageNet ผู้ดูแลเซิร์ฟเวอร์การประเมิน ImageNet อนุญาตให้ผู้ใช้รายเดียวส่งการส่งได้สูงสุด 2 รายการต่อสัปดาห์ เพื่อป้องกันการส่งเกิน

ในการประเมินความถูกต้องของการทดสอบ ขั้นแรกต้องสร้างบัญชีที่ image-net.org บัญชีนี้ต้องได้รับการอนุมัติจากผู้ดูแลไซต์ หลังจากที่บัญชีจะถูกสร้างขึ้นหนึ่งสามารถส่งผลไปยังเซิร์ฟเวอร์ทดสอบที่ https://image-net.org/challenges/LSVRC/eval_server.php ส่งประกอบด้วยไฟล์ข้อความ ASCII หลายสอดคล้องกับงานหลาย ๆ งานที่น่าสนใจคือ "การส่งการจัดประเภท (ข้อผิดพลาด top-5 cls)" ตัวอย่างไฟล์ข้อความที่ส่งออกมีลักษณะดังนี้:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

รูปแบบการส่งออกที่มีการอธิบายไว้ในเต็มรูปแบบใน "readme.txt" ในชุด 2013 การพัฒนาอยู่ที่นี่: http://imagenet.stanford.edu/image/ilsvrc2013/ILSVRC2013_devkit.tgz โปรดดูหัวข้อ "รูปแบบการส่ง 3.3 CLS-LOC ". โดยสังเขป รูปแบบของไฟล์ข้อความคือ 100,000 บรรทัดที่สอดคล้องกับแต่ละภาพในการทดสอบแยก จำนวนเต็มแต่ละบรรทัดสอดคล้องกับการคาดคะเนอันดับสูงสุด 5 อันดับแรกสำหรับรูปภาพทดสอบแต่ละรูป จำนวนเต็มเป็น 1 ดัชนีที่สอดคล้องกับหมายเลขบรรทัดในไฟล์ป้ายกำกับที่เกี่ยวข้อง ดู imagenet2012_labels.txt

  • โฮมเพจ: http://image-net.org/

  • รหัสที่มา: tfds.image_classification.Imagenet2012

  • รุ่น:

    • 2.0.0 : ป้ายตรวจสอบแก้ไข
    • 2.0.1 : แก้ไขการเข้ารหัส ไม่มีการเปลี่ยนแปลงจากมุมมองของผู้ใช้
    • 3.0.0 : แก้ไข colorization บน ~ 12 ภาพ (CMYK -> RGB) แก้ไขรูปแบบเพื่อความสอดคล้อง (แปลงภาพ png เดียวเป็น Jpeg) รุ่นที่เร็วกว่าการอ่านโดยตรงจากไฟล์เก็บถาวร

    • 4.0.0 : (ไม่ได้เผยแพร่)

    • 5.0.0 : แยก API ใหม่ ( https://tensorflow.org/datasets/splits )

    • 5.1.0 (เริ่มต้น): เพิ่มการทดสอบแยก

  • ขนาดการดาวน์โหลด: Unknown size

  • ขนาดชุด: 155.84 GiB

  • คำแนะนำการดาวน์โหลดคู่มือ: ชุดนี้คุณจะต้องดาวน์โหลดข้อมูลแหล่งที่มาของตนเองลงใน download_config.manual_dir (ค่าเริ่มต้น ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir ควรประกอบด้วยสองไฟล์: ILSVRC2012_img_train.tar และ ILSVRC2012_img_val.tar คุณจำเป็นต้องลงทะเบียนใน http://www.image-net.org/download-images เพื่อให้ได้รับลิงค์เพื่อดาวน์โหลดชุดข้อมูล

  • ออโต้แคช ( เอกสาร ): ไม่มี

  • แยก:

แยก ตัวอย่าง
'test' 100,000
'train' 1,281,167
'validation' 50,000
  • คุณสมบัติ:
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})

การสร้างภาพ

  • อ้างอิง:
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}