Эта страница была переведа с помощью Cloud Translation API.
Switch to English

лесные пожары

  • Описание :

Это задача регрессии, цель которой - прогнозировать площадь выгоревших лесных пожаров в северо-восточном регионе Португалии с использованием метеорологических и других данных.

Информация о наборе данных:

В [Cortez and Morais, 2007] выходная «площадь» сначала была преобразована с помощью функции ln (x + 1). Затем были применены несколько методов интеллектуального анализа данных. После подбора моделей выходные данные были обработаны с помощью обратного преобразования ln (x + 1). Использовались четыре различных типа входных сигналов. Эксперименты проводились с использованием 10-кратной (перекрестная проверка) x 30 запусков. Были измерены два показателя регрессии: MAD и RMSE. Машина с опорным вектором Гаусса (SVM), получавшая только 4 прямых погодных условия (температура, относительная влажность, ветер и дождь), получила лучшее значение MAD: 12,71 + - 0,01 (средний и доверительный интервалы в пределах 95% с использованием распределения t-Стьюдента). Наилучшее RMSE было получено с помощью наивного предиктора среднего. Анализ кривой ошибок регрессии (REC) показывает, что модель SVM предсказывает больше примеров в пределах более низкой допустимой ошибки. Фактически, модель SVM лучше предсказывает небольшие пожары, которых является большинство.

Информация об атрибутах:

Для получения дополнительной информации прочтите [Cortez and Morais, 2007].

  1. X - пространственная координата по оси X на карте парка Монтесинью: от 1 до 9.
  2. Y - пространственная координата оси Y на карте парка Монтесиньо: от 2 до 9
  3. month - месяц года: от jan до dec
  4. day - день недели: от 'пн' до 'вс'
  5. FFMC - индекс FFMC из системы FWI: от 18,7 до 96,20
  6. DMC - индекс DMC из системы FWI: от 1,1 до 291,3
  7. DC - индекс постоянного тока из системы FWI: от 7,9 до 860,6
  8. ISI - индекс ISI из системы FWI: от 0,0 до 56,10
  9. temp - температура в градусах Цельсия: от 2,2 до 33,30
  10. RH - относительная влажность в%: от 15,0 до 100
  11. wind - скорость ветра в км / ч: от 0,40 до 9,40
  12. дождь - наружный дождь в мм / м2: от 0,0 до 6,4
  13. площадь - площадь выгоревшего леса (в га): от 0,00 до 1090,84 (эта выходная переменная сильно отклонена в сторону 0,0, поэтому может иметь смысл моделировать с помощью логарифмического преобразования).
Трещина Примеры
'train' 517
  • Особенности :
FeaturesDict({
    'area': tf.float32,
    'features': FeaturesDict({
        'DC': tf.float32,
        'DMC': tf.float32,
        'FFMC': tf.float32,
        'ISI': tf.float32,
        'RH': tf.float32,
        'X': tf.uint8,
        'Y': tf.uint8,
        'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
        'rain': tf.float32,
        'temp': tf.float32,
        'wind': tf.float32,
    }),
})
  • Контролируемые ключи (см. as_supervised doc ): ('area', 'features')

  • Цитата :

@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}