feux de forêt

  • Descriptif :

Il s'agit d'une tâche de régression, dont le but est de prédire la superficie brûlée des incendies de forêt, dans la région nord-est du Portugal, en utilisant des données météorologiques et autres.

Informations sur l'ensemble de données :

Dans [Cortez and Morais, 2007], la sortie 'area' a d'abord été transformée avec une fonction ln(x+1). Ensuite, plusieurs méthodes de Data Mining ont été appliquées. Après ajustement des modèles, les sorties ont été post-traitées avec l'inverse de la transformée ln(x+1). Quatre configurations d'entrée différentes ont été utilisées. Les expériences ont été menées en utilisant 10 fois (validation croisée) x 30 essais. Deux métriques de régression ont été mesurées : MAD et RMSE. Une machine à vecteurs de support gaussien (SVM) alimentée avec seulement 4 conditions météorologiques directes (température, RH, vent et pluie) a obtenu la meilleure valeur MAD : 12,71 +- 0,01 (moyenne et intervalle de confiance à 95 % en utilisant une distribution t-student). Le meilleur RMSE a été atteint par le prédicteur moyen naïf. Une analyse de la courbe d'erreur de régression (REC) montre que le modèle SVM prédit plus d'exemples avec une erreur admise inférieure. En effet, le modèle SVM prédit mieux les petits feux, qui sont majoritaires.

Informations sur les attributs :

Pour plus d'informations, lire [Cortez et Morais, 2007].

  1. X - coordonnée spatiale sur l'axe des x dans la carte du parc de Montesinho : 1 à 9
  2. Y - Coordonnée spatiale sur l'axe des ordonnées dans la carte du parc de Montesinho : 2 à 9
  3. mois - mois de l'année : 'jan' à 'dec'
  4. jour - jour de la semaine : 'lun' à 'dim'
  5. FFMC - Indice FFMC du système FWI : 18,7 à 96,20
  6. DMC - Indice DMC du système FWI : 1,1 à 291,3
  7. Indice DC - DC du système FWI : 7,9 à 860,6
  8. ISI - Indice ISI du système FWI : 0,0 à 56,10
  9. temp - température en degrés Celsius : 2,2 à 33,30
  10. HR - humidité relative en % : 15,0 à 100
  11. vent - vitesse du vent en km/h : 0,40 à 9,40
  12. pluie - pluie extérieure en mm/m2 : 0,0 à 6,4
  13. surface - la surface brûlée de la forêt (en ha) : 0,00 à 1090,84 (cette variable de sortie est très biaisée vers 0,0, il peut donc être judicieux de modéliser avec la transformée logarithmique).
Diviser Exemples
'train' 517
  • Structure des fonctionnalités :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
Région Tenseur float32
Caractéristiques FonctionnalitésDict
caractéristiques/CC Tenseur float32
fonctionnalités/DMC Tenseur float32
fonctionnalités/FFMC Tenseur float32
caractéristiques/ISI Tenseur float32
caractéristiques/HR Tenseur float32
caractéristiques/X Tenseur uint8
caractéristiques/Y Tenseur uint8
fonctionnalités/jour Étiquette de classe int64
fonctionnalités/mois Étiquette de classe int64
caractéristiques/pluie Tenseur float32
caractéristiques/température Tenseur float32
caractéristiques/vent Tenseur float32
  • Citation :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}