- توضیحات :
این یک وظیفه بازگشتی است ، جایی که هدف پیش بینی منطقه سوخته آتش سوزی جنگل ها ، در منطقه شمال شرقی پرتغال ، با استفاده از داده های هواشناسی و سایر داده ها است.
اطلاعات مجموعه داده ها:
در [کورتز و مورایس ، 2007] ، "منطقه" خروجی ابتدا با یک تابع ln (x + 1) تغییر شکل داد. سپس ، چندین روش داده کاوی استفاده شد. پس از برازش مدل ها ، خروجی ها با معکوس تبدیل ln (x + 1) پردازش شدند. از چهار تنظیم مختلف ورودی استفاده شده است. این آزمایشات با استفاده از 10 بار اجرا (10 بار اعتبار سنجی) x 30 اجرا شد. دو معیار رگرسیون اندازه گیری شد: MAD و RMSE. یک ماشین بردار پشتیبان گاوسی (SVM) که فقط با 4 شرایط آب و هوایی مستقیم (دما ، RH ، باد و باران) تغذیه می شود بهترین مقدار MAD را به دست آورد: 71/12 + - 01/01 (میانگین و اطمینان اطمینان در 95٪ با استفاده از توزیع t-student). بهترین RMSE با پیش بینی میانگین ساده لوحی بدست آمد. تجزیه و تحلیل منحنی خطای رگرسیون (REC) نشان می دهد که مدل SVM نمونه های بیشتری را در یک خطای پذیرفته شده کمتر پیش بینی می کند. در حقیقت ، مدل SVM آتش سوزی های کوچک بهتر را که اکثریت آنها هستند ، پیش بینی می کند.
اطلاعات ویژگی:
برای اطلاعات بیشتر ، [کورتز و مورایس ، 2007] را بخوانید.
- X - مختصات مکانی محور x در نقشه پارک Montesinho: 1 تا 9
- مختصات مکانی محور Y - در نقشه پارک مونتزینیو: 2 تا 9
- ماه - ماه سال: 'jan' تا 'dec'
- روز - روز هفته: "دوشنبه" تا "خورشید"
- FFMC - شاخص FFMC از سیستم FWI: 18.7 تا 96.20
- DMC - شاخص DMC از سیستم FWI: 1.1 تا 291.3
- شاخص DC - DC از سیستم FWI: 7.9 تا 860.6
- ISI - شاخص ISI از سیستم FWI: 0.0 تا 56.10
- دما - درجه حرارت در درجه سانتیگراد: 2.2 تا 33.30
- RH - رطوبت نسبی در:: 15.0 تا 100
- باد - سرعت باد در کیلومتر در ساعت: 0.40 تا 9.40
- باران - باران بیرون در میلی متر بر متر مربع: 0.0 تا 6.4
- area - منطقه سوخته جنگل (در هکتار): 0.00 تا 1090.84 (این متغیر خروجی نسبت به 0.0 بسیار کج است ، بنابراین ممکن است منطقی باشد که با تبدیل لگاریتم مدل سازی شود).
صفحه اصلی : https://archive.ics.uci.edu/ml/datasets/Forest+Fires
کد منبع :
tfds.structured.ForestFires
نسخه ها :
-
0.0.1
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
24.88 KiB
اندازه مجموعه داده :
162.07 KiB
ذخیره خودکار ( مستندات ): بله
تقسیم :
شکاف | مثال ها |
---|---|
'train' | 517 |
- ویژگی ها :
FeaturesDict({
'area': tf.float32,
'features': FeaturesDict({
'DC': tf.float32,
'DMC': tf.float32,
'FFMC': tf.float32,
'ISI': tf.float32,
'RH': tf.float32,
'X': tf.uint8,
'Y': tf.uint8,
'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
'rain': tf.float32,
'temp': tf.float32,
'wind': tf.float32,
}),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):('area', 'features')
نقل قول :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }
@article{cortez2007data,
title={A data mining approach to predict forest fires using meteorological data},
author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
year={2007},
publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):