- Описание:
Это задача регрессии, цель которой состоит в том, чтобы спрогнозировать площадь выгоревших лесных пожаров в северо-восточном регионе Португалии с использованием метеорологических и других данных.
Информация о наборе данных:
В [Cortez and Morais, 2007] выходная «площадь» сначала была преобразована с помощью функции ln (x + 1). Затем были применены несколько методов интеллектуального анализа данных. После подбора моделей выходные данные подвергались постобработке с использованием преобразования, обратного преобразованию ln (x + 1). Использовались четыре различных типа входов. Эксперименты проводились с использованием 10-кратной (перекрестная проверка) х 30 запусков. Были измерены два показателя регрессии: MAD и RMSE. Машина с опорным вектором Гаусса (SVM), получавшая только 4 прямых погодных условия (температура, относительная влажность, ветер и дождь), получила лучшее значение MAD: 12,71 + - 0,01 (средний и доверительный интервал в пределах 95% с использованием распределения t-Стьюдента). Наилучшее RMSE было получено с помощью наивного предиктора среднего. Анализ кривой ошибок регрессии (REC) показывает, что модель SVM предсказывает больше примеров в пределах более низкой допустимой ошибки. Фактически, модель SVM лучше предсказывает небольшие пожары, которых является большинство.
Информация об атрибутах:
Для получения дополнительной информации прочтите [Cortez and Morais, 2007].
- X - пространственная координата по оси X на карте парка Монтесинью: от 1 до 9.
- Y - пространственная координата оси Y на карте парка Монтесинью: от 2 до 9.
- month - месяц года: от jan до dec
- day - день недели: от 'пн' до 'вс'
- FFMC - индекс FFMC из системы FWI: от 18,7 до 96,20
- DMC - индекс DMC из системы FWI: от 1,1 до 291,3
- DC - индекс постоянного тока из системы FWI: от 7,9 до 860,6
- ISI - индекс ISI из системы FWI: от 0,0 до 56,10
- temp - температура в градусах Цельсия: от 2,2 до 33,30
- RH - относительная влажность в%: от 15,0 до 100
- wind - скорость ветра в км / ч: от 0,40 до 9,40
- дождь - наружный дождь в мм / м2: от 0,0 до 6,4
- area - площадь выгоревшего леса (в га): от 0,00 до 1090,84 (эта выходная переменная сильно отклонена в сторону 0,0, поэтому может иметь смысл моделировать с помощью логарифмического преобразования).
Домашняя страница: https://archive.ics.uci.edu/ml/datasets/Forest+Fires
Исходный код:
tfds.structured.ForestFires
Версии:
-
0.0.1
( по умолчанию): Нет Замечания к выпуску.
-
Скачать Размер:
24.88 KiB
Dataset Размер:
162.07 KiB
Авто-кэшируются ( документация ): Да
расколы:
Расколоть | Примеры |
---|---|
'train' | 517 |
- Особенности:
FeaturesDict({
'area': tf.float32,
'features': FeaturesDict({
'DC': tf.float32,
'DMC': tf.float32,
'FFMC': tf.float32,
'ISI': tf.float32,
'RH': tf.float32,
'X': tf.uint8,
'Y': tf.uint8,
'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
'rain': tf.float32,
'temp': tf.float32,
'wind': tf.float32,
}),
})
Контролируемые ключи (См
as_supervised
документ ):('area', 'features')
Рис ( tfds.show_examples ): Не поддерживается.
Примеры ( tfds.as_dataframe ):
- Образец цитирования:
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }
@article{cortez2007data,
title={A data mining approach to predict forest fires using meteorological data},
author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
year={2007},
publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}