Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

incendios forestales

  • Descripción:

Se trata de una tarea de regresión, donde el objetivo es predecir el área quemada de los incendios forestales, en la región noreste de Portugal, utilizando datos meteorológicos y de otro tipo.

Información del conjunto de datos:

En [Cortez y Morais, 2007], el 'área' de salida se transformó primero con una función ln (x + 1). Luego, se aplicaron varios métodos de Data Mining. Después de ajustar los modelos, las salidas se procesaron posteriormente con la inversa de la transformada ln (x + 1). Se utilizaron cuatro configuraciones de entrada diferentes. Los experimentos se realizaron utilizando 10 veces (validación cruzada) x 30 ejecuciones. Se midieron dos métricas de regresión: MAD y RMSE. Una máquina de vector de soporte gaussiano (SVM) alimentada con solo 4 condiciones climáticas directas (temperatura, HR, viento y lluvia) obtuvo el mejor valor de MAD: 12,71 + - 0,01 (media e intervalo de confianza dentro del 95% utilizando una distribución t-student). La mejor RMSE se obtuvo mediante el predictor medio ingenuo. Un análisis de la curva de error de regresión (REC) muestra que el modelo SVM predice más ejemplos dentro de un error admitido más bajo. En efecto, el modelo SVM predice mejor los incendios pequeños, que son la mayoría.

Información de atributos:

Para obtener más información, lea [Cortez y Morais, 2007].

  1. X - coordenada espacial del eje x dentro del mapa del parque Montesinho: 1 a 9
  2. Y - coordenada espacial del eje y dentro del mapa del parque Montesinho: 2 a 9
  3. mes - mes del año: 'jan' a 'dic'
  4. día - día de la semana: 'mon' a 'sun'
  5. FFMC - Índice FFMC del sistema FWI: 18,7 a 96,20
  6. DMC - Índice DMC del sistema FWI: 1.1 a 291.3
  7. DC - Índice DC del sistema FWI: 7,9 a 860,6
  8. ISI - Índice ISI del sistema FWI: 0.0 a 56.10
  9. temp - temperatura en grados Celsius: 2.2 a 33.30
  10. RH - humedad relativa en%: 15.0 a 100
  11. viento - velocidad del viento en km / h: 0,40 a 9,40
  12. lluvia - lluvia exterior en mm / m2: 0,0 a 6,4
  13. área - el área quemada del bosque (en ha): 0.00 a 1090.84 (esta variable de salida está muy sesgada hacia 0.0, por lo que puede tener sentido modelar con la transformada logarítmica).
Separar Ejemplos de
'train' 517
  • características:
FeaturesDict({
    'area': tf.float32,
    'features': FeaturesDict({
        'DC': tf.float32,
        'DMC': tf.float32,
        'FFMC': tf.float32,
        'ISI': tf.float32,
        'RH': tf.float32,
        'X': tf.uint8,
        'Y': tf.uint8,
        'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
        'rain': tf.float32,
        'temp': tf.float32,
        'wind': tf.float32,
    }),
})
  • Cita:
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}