incendios forestales

  • Descripción :

Esta es una tarea de regresión, donde el objetivo es predecir el área quemada de los incendios forestales, en la región noreste de Portugal, utilizando datos meteorológicos y otros.

Información del conjunto de datos:

En [Cortez and Morais, 2007], el 'área' de salida se transformó primero con una función ln(x+1). Luego, se aplicaron varios métodos de Minería de Datos. Después de ajustar los modelos, las salidas se postprocesaron con el inverso de la transformada ln(x+1). Se utilizaron cuatro configuraciones de entrada diferentes. Los experimentos se realizaron utilizando 10 veces (validación cruzada) x 30 ejecuciones. Se midieron dos métricas de regresión: MAD y RMSE. Una máquina de vectores de soporte gaussiana (SVM) alimentada con solo 4 condiciones climáticas directas (temperatura, HR, viento y lluvia) obtuvo el mejor valor de MAD: 12.71 +- 0.01 (media e intervalo de confianza dentro del 95% usando una distribución t-student). El mejor RMSE fue alcanzado por el predictor medio ingenuo. Un análisis de la curva de error de regresión (REC) muestra que el modelo SVM predice más ejemplos dentro de un error admitido más bajo. En efecto, el modelo SVM predice mejor los incendios pequeños, que son la mayoría.

Información de atributos:

Para obtener más información, lea [Cortez y Morais, 2007].

  1. X - coordenada espacial del eje x dentro del mapa del parque Montesinho: 1 a 9
  2. Y - Coordenada espacial del eje y dentro del mapa del parque Montesinho: 2 a 9
  3. mes - mes del año: 'ene' a 'dic'
  4. día - día de la semana: 'mon' a 'sun'
  5. FFMC - Índice FFMC del sistema FWI: 18.7 a 96.20
  6. DMC - Índice DMC del sistema FWI: 1.1 a 291.3
  7. DC - Índice DC del sistema FWI: 7.9 a 860.6
  8. ISI - Índice ISI del sistema FWI: 0.0 a 56.10
  9. temp - temperatura en grados Celsius: 2.2 a 33.30
  10. HR - humedad relativa en %: 15,0 a 100
  11. viento - velocidad del viento en km/h: 0,40 a 9,40
  12. lluvia - lluvia exterior en mm/m2 : 0,0 a 6,4
  13. área - el área quemada del bosque (en ha): 0,00 a 1090,84 (esta variable de salida está muy sesgada hacia 0,0, por lo que puede tener sentido modelar con la transformada logarítmica).
Separar Ejemplos
'train' 517
  • Estructura de características :
FeaturesDict({
    'area': tf.float32,
    'features': FeaturesDict({
        'DC': tf.float32,
        'DMC': tf.float32,
        'FFMC': tf.float32,
        'ISI': tf.float32,
        'RH': tf.float32,
        'X': tf.uint8,
        'Y': tf.uint8,
        'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
        'rain': tf.float32,
        'temp': tf.float32,
        'wind': tf.float32,
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
área Tensor tf.float32
caracteristicas CaracterísticasDict
caracteristicas/DC Tensor tf.float32
características/DMC Tensor tf.float32
características/FFMC Tensor tf.float32
caracteristicas/ISI Tensor tf.float32
caracteristicas/HR Tensor tf.float32
caracteristicas/X Tensor tf.uint8
caracteristicas/Y Tensor tf.uint8
caracteristicas/dia Etiqueta de clase tf.int64
funciones/mes Etiqueta de clase tf.int64
caracteristicas/lluvia Tensor tf.float32
caracteristicas/temperatura Tensor tf.float32
caracteristicas/viento Tensor tf.float32
  • Cita :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c}}{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}