ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

symmetric_solids

  • รายละเอียด:

นี่คือชุดข้อมูลการประมาณการท่าทาง ซึ่งประกอบด้วยรูปร่าง 3 มิติแบบสมมาตร ซึ่งการวางแนวหลายแนวจะแยกไม่ออกทางสายตา ความท้าทายคือการทำนายทิศทางที่เท่ากันทั้งหมดเมื่อมีการจับคู่การวางแนวเดียวกับแต่ละภาพระหว่างการฝึก ตรงกันข้ามกับชุดข้อมูลการประมาณค่าท่าทางส่วนใหญ่ ชุดของการวางแนวที่เทียบเท่ากันทั้งหมดนั้นพร้อมสำหรับการประเมิน

มีทั้งหมดแปดรูปร่าง โดยแต่ละแบบเรนเดอร์จาก 50,000 มุมมองที่กระจายอย่างเท่าเทียมกันโดยการสุ่มบนพื้นที่เต็มของการหมุน 3 มิติ ห้ารูปร่างไม่มีลักษณะเฉพาะ -- จัตุรมุข ลูกบาศก์ icosahedron กรวย และทรงกระบอก ในจำนวนนี้ ของแข็งพลาโทนิกสามชนิด (จัตุรมุข คิวบ์ ไอโคซาเฮดรอน) ได้รับการใส่คำอธิบายประกอบด้วยความสมมาตรที่ไม่ต่อเนื่องกัน 12, 24 และ 60 เท่า ตามลำดับ กรวยและทรงกระบอกมีคำอธิบายประกอบด้วยความสมมาตรอย่างต่อเนื่องแยกส่วนกันที่ช่วง 1 องศา ความสมมาตรเหล่านี้มีไว้สำหรับการประเมิน การควบคุมดูแลที่ตั้งใจไว้เป็นเพียงการหมุนครั้งเดียวกับแต่ละภาพ

อีกสามรูปร่างที่เหลือจะถูกทำเครื่องหมายด้วยลักษณะเด่น มีจัตุรมุขที่มีใบหน้าสีแดงหนึ่งรูป ทรงกระบอกที่มีจุดอยู่ตรงกลาง และทรงกลมที่มีเครื่องหมาย X ต่อยอดด้วยจุด ไม่ว่าจะมองเห็นลักษณะเด่นหรือไม่ก็ตาม พื้นที่ของการวางแนวที่เป็นไปได้จะลดลง เราไม่ได้จัดเตรียมชุดการหมุนที่เท่ากันสำหรับรูปร่างเหล่านี้

แต่ละตัวอย่างประกอบด้วยของ

  • ภาพ RGB 224x224
  • ดัชนีรูปร่างเพื่อให้ชุดข้อมูลถูกกรองตามรูปร่าง
    ดัชนีสอดคล้องกับ:

    • 0 = จัตุรมุข
    • 1 = ลูกบาศก์
    • 2 = icosahedron
    • 3 = โคน
    • 4 = กระบอก
    • 5 = ทำเครื่องหมายจัตุรมุข
    • 6 = กระบอกทำเครื่องหมาย
    • 7 = ทรงกลมที่ทำเครื่องหมายไว้
  • การหมุนที่ใช้ในกระบวนการเรนเดอร์ ซึ่งแสดงเป็นเมทริกซ์การหมุน 3x3

  • ชุดของการหมุนที่เทียบเท่าที่รู้จักภายใต้ความสมมาตรสำหรับการประเมิน

ในกรณีของรูปร่างที่ทำเครื่องหมายไว้สามรูปร่าง นี่เป็นเพียงการหมุนการแสดงผลเท่านั้น

แยก ตัวอย่าง
'test' 40,000
'train' 360,000
  • คุณสมบัติ:
FeaturesDict({
    'image': Image(shape=(224, 224, 3), dtype=tf.uint8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'rotation': Tensor(shape=(3, 3), dtype=tf.float32),
    'rotations_equivalent': Tensor(shape=(None, 3, 3), dtype=tf.float32),
})

การสร้างภาพ

  • อ้างอิง:
@inproceedings{implicitpdf2021,
  title = {Implicit Representation of Probability Distributions on the Rotation
  Manifold},
  author = {Murphy, Kieran and Esteves, Carlos and Jampani, Varun and
  Ramalingam, Srikumar and Makadia, Ameesh}
  booktitle = {International Conference on Machine Learning}
  year = {2021}
}