feux de forêt

  • Description:

Il s'agit d'une tâche de régression, dont le but est de prédire la superficie brûlée par les incendies de forêt, dans la région nord-est du Portugal, en utilisant des données météorologiques et autres.

Informations sur l'ensemble de données :

Dans [Cortez et Morais, 2007], la « zone » de sortie a d'abord été transformée avec une fonction ln(x+1). Ensuite, plusieurs méthodes de Data Mining ont été appliquées. Après ajustement des modèles, les sorties ont été post-traitées avec l'inverse de la transformée ln(x+1). Quatre configurations d'entrée différentes ont été utilisées. Les expériences ont été menées à l'aide d'un 10 fois (validation croisée) x 30 courses. Deux métriques de régression ont été mesurées : MAD et RMSE. Une machine à vecteur de support gaussien (SVM) alimentée avec seulement 4 conditions météorologiques directes (temp, RH, vent et pluie) a obtenu la meilleure valeur MAD : 12,71 +- 0,01 (moyenne et intervalle de confiance à moins de 95% en utilisant une distribution t-student). Le meilleur RMSE a été atteint par le prédicteur moyen naïf. Une analyse de la courbe d'erreur de régression (REC) montre que le modèle SVM prédit plus d'exemples avec une erreur admise inférieure. En effet, le modèle SVM prédit de meilleurs petits feux, qui sont majoritaires.

Informations sur les attributs :

Pour plus d'informations, lire [Cortez et Morais, 2007].

  1. X - Coordonnée spatiale de l'axe x dans la carte du parc Montesinho : 1 à 9
  2. Y - coordonnée spatiale de l'axe y dans la carte du parc Montesinho : 2 à 9
  3. mois - mois de l'année : 'jan' à 'déc'
  4. jour - jour de la semaine : « lundi » à « dimanche »
  5. FFMC - Indice FFMC du système FWI : 18,7 à 96,20
  6. DMC - Indice DMC du système FWI : 1.1 à 291.3
  7. DC - Indice DC du système FWI : 7,9 à 860,6
  8. ISI - Indice ISI du système FWI : 0,0 à 56,10
  9. temp - température en degrés Celsius : 2,2 à 33,30
  10. RH - humidité relative en % : 15,0 à 100
  11. vent - vitesse du vent en km/h : 0,40 à 9,40
  12. pluie - pluie extérieure en mm/m2 : 0,0 à 6,4
  13. superficie - la superficie brûlée de la forêt (en ha) : 0,00 à 1090,84 (cette variable de sortie est très asymétrique vers 0,0, il peut donc être judicieux de modéliser avec la transformation logarithmique).
Diviser Exemples
'train' 517
  • Caractéristiques:
FeaturesDict({
    'area': tf.float32,
    'features': FeaturesDict({
        'DC': tf.float32,
        'DMC': tf.float32,
        'FFMC': tf.float32,
        'ISI': tf.float32,
        'RH': tf.float32,
        'X': tf.uint8,
        'Y': tf.uint8,
        'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
        'rain': tf.float32,
        'temp': tf.float32,
        'wind': tf.float32,
    }),
})
  • citation:
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}