O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

incêndios florestais

  • Descrição:

Trata-se de uma tarefa de regressão, onde se pretende prever a área queimada por incêndios florestais, na região Nordeste de Portugal, com recurso a dados meteorológicos e outros.

Informações do conjunto de dados:

Em [Cortez e Morais, 2007], a 'área' de saída foi primeiro transformada com uma função ln (x + 1). Em seguida, vários métodos de Data Mining foram aplicados. Após o ajuste dos modelos, as saídas foram pós-processadas com o inverso da transformada ln (x + 1). Quatro configurações de entrada diferentes foram usadas. Os experimentos foram conduzidos usando 10 vezes (validação cruzada) x 30 execuções. Duas métricas de regressão foram medidas: MAD e RMSE. Uma máquina de vetor de suporte gaussiano (SVM) alimentada com apenas 4 condições climáticas diretas (temperatura, UR, vento e chuva) obteve o melhor valor MAD: 12,71 + - 0,01 (média e intervalo de confiança dentro de 95% usando uma distribuição t-student). O melhor RMSE foi obtido pelo preditor de média ingênua. Uma análise da curva de erro de regressão (REC) mostra que o modelo SVM prevê mais exemplos dentro de um erro admitido inferior. Com efeito, o modelo SVM prevê melhor os pequenos incêndios, que são a maioria.

Informação de Atributo:

Para mais informações, leia [Cortez e Morais, 2007].

  1. X - coordenada espacial do eixo x no mapa do parque de Montesinho: 1 a 9
  2. Y - coordenada espacial do eixo y no mapa do parque de Montesinho: 2 a 9
  3. mês - mês do ano: 'jan' a 'dez'
  4. dia - dia da semana: 'seg' a 'sol'
  5. FFMC - Índice FFMC do sistema FWI: 18,7 a 96,20
  6. DMC - Índice DMC do sistema FWI: 1,1 a 291,3
  7. DC - índice DC do sistema FWI: 7,9 a 860,6
  8. ISI - índice ISI do sistema FWI: 0,0 a 56,10
  9. temp - temperatura em graus Celsius: 2,2 a 33,30
  10. RH - umidade relativa em%: 15,0 a 100
  11. vento - velocidade do vento em km / h: 0,40 a 9,40
  12. chuva - chuva externa em mm / m2: 0,0 a 6,4
  13. área - a área queimada da floresta (em ha): 0,00 a 1090,84 (esta variável de saída é muito inclinada para 0,0, portanto, pode fazer sentido modelar com a transformação logarítmica).
Dividir Exemplos
'train' 517
  • Características:
FeaturesDict({
    'area': tf.float32,
    'features': FeaturesDict({
        'DC': tf.float32,
        'DMC': tf.float32,
        'FFMC': tf.float32,
        'ISI': tf.float32,
        'RH': tf.float32,
        'X': tf.uint8,
        'Y': tf.uint8,
        'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
        'rain': tf.float32,
        'temp': tf.float32,
        'wind': tf.float32,
    }),
})
  • citação:
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}