Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

Pożary lasów

  • opis:

Jest to zadanie regresji, którego celem jest przewidzenie spalonego obszaru pożarów lasów w północno-wschodnim regionie Portugalii przy użyciu danych meteorologicznych i innych.

Informacje o zbiorze danych:

W [Cortez i Morais, 2007] „obszar” wyjścia został najpierw przekształcony za pomocą funkcji ln(x+1). Następnie zastosowano kilka metod Data Mining. Po dopasowaniu modeli wyniki zostały poddane obróbce końcowej z odwrotnością transformacji ln(x+1). Zastosowano cztery różne konfiguracje wejściowe. Eksperymenty przeprowadzono stosując 10-krotne (walidacja krzyżowa) x 30 przebiegów. Mierzono dwie metryki regresji: MAD i RMSE. Maszyna wektora nośnego Gaussa (SVM) zasilana tylko 4 bezpośrednimi warunkami pogodowymi (temperatura, wilgotność względna, wiatr i deszcz) uzyskała najlepszą wartość MAD: 12,71 ± 0,01 (średnia i przedział ufności w granicach 95% przy użyciu rozkładu t-studenta). Najlepszy RMSE został osiągnięty przez naiwny predyktor średniej. Analiza krzywej błędu regresji (REC) pokazuje, że model SVM przewiduje więcej przykładów z niższym dopuszczalnym błędem. W efekcie model SVM lepiej przewiduje małe pożary, które stanowią większość.

Informacje o atrybucie:

Aby uzyskać więcej informacji, przeczytaj [Cortez i Morais, 2007].

  1. X - współrzędna przestrzenna osi x na mapie parku Montesinho: od 1 do 9
  2. Y - współrzędna przestrzenna osi y na mapie parku Montesinho: 2 do 9
  3. miesiąc - miesiąc w roku: 'jan' do 'gru'
  4. dzień - dzień tygodnia: 'pon' do 'sun'
  5. FFMC - indeks FFMC z systemu FWI: 18,7 do 96,20
  6. DMC - indeks DMC z systemu FWI: 1,1 do 291,3
  7. DC - indeks DC z systemu FWI: 7,9 do 860,6
  8. ISI - indeks ISI z systemu FWI: 0,0 do 56,10
  9. temp - temperatura w stopniach Celsjusza: 2,2 do 33,30
  10. RH - wilgotność względna w %: 15,0 do 100
  11. wiatr - prędkość wiatru w km/h: 0,40 do 9,40
  12. deszcz - deszcz na zewnątrz w mm/m2 : 0,0 do 6,4
  13. area - wypalona powierzchnia lasu (w ha): 0,00 do 1090,84 (ta zmienna wyjściowa jest bardzo przekrzywiona w kierunku 0,0, więc sensowne może być modelowanie z transformacją logarytmiczną).
Podział Przykłady
'train' 517
  • Cechy:
FeaturesDict({
    'area': tf.float32,
    'features': FeaturesDict({
        'DC': tf.float32,
        'DMC': tf.float32,
        'FFMC': tf.float32,
        'ISI': tf.float32,
        'RH': tf.float32,
        'X': tf.uint8,
        'Y': tf.uint8,
        'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
        'rain': tf.float32,
        'temp': tf.float32,
        'wind': tf.float32,
    }),
})
  • cytat:
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}