ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

forest_fires

  • รายละเอียด:

งานนี้เป็นงานถดถอย โดยมีจุดมุ่งหมายเพื่อทำนายพื้นที่ไฟไหม้ป่าที่ถูกไฟไหม้ ในภาคตะวันออกเฉียงเหนือของโปรตุเกส โดยใช้ข้อมูลอุตุนิยมวิทยาและข้อมูลอื่น ๆ

ข้อมูลชุดข้อมูล:

ใน [Cortez and Morais, 2007] 'พื้นที่' เอาต์พุตถูกแปลงเป็นครั้งแรกด้วยฟังก์ชัน ln(x+1) จากนั้นจึงใช้วิธีการทำเหมืองข้อมูลหลายวิธี หลังจากติดตั้งโมเดลแล้ว ผลลัพธ์จะถูกประมวลผลภายหลังด้วยการแปลงผกผันของ ln(x+1) ใช้การตั้งค่าอินพุตที่แตกต่างกันสี่แบบ การทดลองดำเนินการโดยใช้การวิ่ง 10 เท่า (การตรวจสอบข้าม) x 30 ครั้ง วัดการถดถอยสองรายการ: MAD และ RMSE เครื่องเวกเตอร์สนับสนุนแบบเกาส์เซียน (SVM) ที่มีสภาพอากาศโดยตรงเพียง 4 แบบ (อุณหภูมิ RH ลม และฝน) ได้รับค่า MAD ที่ดีที่สุด: 12.71 +- 0.01 (ช่วงเฉลี่ยและความเชื่อมั่นภายใน 95% โดยใช้การแจกแจงแบบ t-student) RMSE ที่ดีที่สุดได้มาจากตัวทำนายค่าเฉลี่ยไร้เดียงสา การวิเคราะห์เส้นโค้งข้อผิดพลาดการถดถอย (REC) แสดงให้เห็นว่าโมเดล SVM คาดการณ์ตัวอย่างเพิ่มเติมภายในข้อผิดพลาดที่ยอมรับต่ำกว่า ผลที่ได้คือ โมเดล SVM คาดการณ์การเกิดไฟไหม้ขนาดเล็กได้ดีกว่า ซึ่งส่วนใหญ่แล้ว

ข้อมูลแอตทริบิวต์:

สำหรับข้อมูลเพิ่มเติม อ่าน [Cortez and Morais, 2007]

  1. X - พิกัดเชิงพื้นที่แกน x ภายในแผนที่สวนสาธารณะ Montesinho: 1 ถึง 9
  2. Y - พิกัดเชิงพื้นที่แกน y ภายในแผนที่สวนสาธารณะ Montesinho: 2 ถึง 9
  3. เดือน - เดือนของปี: 'ม.ค.' ถึง 'ธ.ค.'
  4. วัน - วันในสัปดาห์: 'จันทร์' ถึง 'อาทิตย์'
  5. FFMC - ดัชนี FFMC จากระบบ FWI: 18.7 ถึง 96.20
  6. DMC - ดัชนี DMC จากระบบ FWI: 1.1 ถึง 291.3
  7. ดัชนี DC - DC จากระบบ FWI: 7.9 ถึง 860.6
  8. ISI - ดัชนี ISI จากระบบ FWI: 0.0 ถึง 56.10
  9. อุณหภูมิ - อุณหภูมิในหน่วยองศาเซลเซียส: 2.2 ถึง 33.30
  10. RH - ความชื้นสัมพัทธ์ใน %: 15.0 ถึง 100
  11. ลม - ความเร็วลมในหน่วย km/h: 0.40 ถึง 9.40
  12. ปริมาณน้ำฝน - ปริมาณน้ำฝนภายนอก หน่วย มม./ตร.ม. : 0.0 ถึง 6.4
  13. พื้นที่ - พื้นที่เผาไหม้ของป่า (เป็นเฮกตาร์): 0.00 ถึง 1090.84 (ตัวแปรเอาท์พุตนี้เบ้ไปทาง 0.0 มาก ดังนั้นจึงควรสร้างแบบจำลองด้วยการแปลงลอการิทึม)
แยก ตัวอย่าง
'train' 517
  • คุณสมบัติ:
FeaturesDict({
    'area': tf.float32,
    'features': FeaturesDict({
        'DC': tf.float32,
        'DMC': tf.float32,
        'FFMC': tf.float32,
        'ISI': tf.float32,
        'RH': tf.float32,
        'X': tf.uint8,
        'Y': tf.uint8,
        'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
        'rain': tf.float32,
        'temp': tf.float32,
        'wind': tf.float32,
    }),
})
  • อ้างอิง:
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}