پیش‌بینی رطوبت نسبی به وسیله مدل یادگیری ماشین XGBoost، مطالعه موردی باجگاه، ایران

نوع مقاله : مقاله پژوهشی

نویسندگان

1 بخش عمران و محیط زیست، دانشکده مهندسی، دانشگاه شیراز، شیراز، ایران

2 دانشکده مهندسی عمران و محیط زیست، دانشگاه تربیت مدرس، تهران، ایران

3 عضو هیئت علمی دانشگاه شیراز

چکیده

چکیده
مقدمه: رطوبت نسبی هوا یکی از مهمترین پارامترهای هیدرولوژیکی است که در مدیریت منابع آب، رشد گیاهان و حتی گیرش بتن تاثیر زیادی دارد.  لذا پیش بینی و تخمین آن از اهمیت بسزایی برخوردار است.
روش­: در این پژوهش از آنجا که پارامترهای رطوبت نسبی و میزان دمای حداقل و حداکثر روزهای قبل، بیشترین تاثیر را در تخمین رطوبت نسبی روز آینده دارند و همچنین وجود آمار تنها این پارامترها در برخی از نقاط کشور، سناریوهای مختلفی مشتمل بر این دو پارامتر مورد مطالعه قرار گرفته است و بهترین سناریو برای پیش بینی رطوبت نسبی با استفاده از مدل XGBoost بدست آمده است. جهت بررسی کارآیی مدل مذکور، منطقه باجگاه در استان فارس مورد تحلیل قرار گرفته و با استفاده از آمار مربوط به سی سال گذشته (1372تا 1402) صحت و دقت سناریوهای مختلف مورد مقایسه قرار گرفته اند. در این راستا ابتدا مقادیری برای داده‌های گمشده به کمک KNN Imputer تخمین زده شده است. سپس میزان ارتباط داده‌های پیشین به کمک همبستگی پیرسون بین متغیر هدف (رطوبت نسبی روز t) و میانگین رطوبت روزانه در بازه یک تا ده روز قبل، محاسبه شده و با توجه به نتایج حاصله مبنی بر کم تاثیر بودن آمار روز چهارم به قبل، آمار مربوط به سه روز قبل مورد استفاده قرار گرفته است.
یافته ­ها و نتیجه ­گیری: در نهایت بر اساس مقایسه نتایج حاصل از 6 شاخص آماری RMSE, MAE, MARE, MXARE, NSE  و R2، مشخص گردید که در بین سناریوهای مختف، سناریو مبتنی بر رطوبت نسبی و دمای حداکثر و حداقل 3 روز قبل بهترین تخمین را ارایه می دهد. 

کلیدواژه‌ها


عنوان مقاله [English]

Relative Humidity Prediction using XGBoost Machine Learning Model, Case Study: Bajgah Climatological Station, Iran

نویسندگان [English]

  • Reza Piraei 1
  • Ali Mohammadi 2
  • Seied Hosein Afzali 3
1 Department of Civil and Environmental ,Engineering, Shiraz University, Shiraz, Iran.
2 School of Civil and Environmental Engineering, Tarbiat Modares University, Tehran, Iran
3 Associate professor of civil eng. in Shiraz University
چکیده [English]

given the prevalence of available data for only these two parameters in many parts of the country, various scenarios involving these parameters were studied. The best scenario for predicting relative humidity was obtained using the XGBoost model. To assess the accuracy of the model, the Bajgah region in Fars Province was chosen as a case study, and the accuracy of different scenarios was compared using data from the past 30 years (1993 to 2023). In this regard, missing data were estimated using the KNN Imputer model. The correlation between mean relative humidity of one to ten days before and the target variable (predicted  relative humidity on day t) was calculated using Pearson correlation. Based on the results indicating the insignificance of data from the fourth day and earlier, data from one to three days before were utilized.
Findings and Conclusion: Finally, by comparing the results based on six statistical criteria (RMSE, MAE, MARE, MXARE, NSE, and R2), it was determined the scenario based on relative humidity and the maximum and minimum temperatures of the preceding 3 days provides the best estimation.

کلیدواژه‌ها [English]

  • Bajgah
  • Machine Learning
  • Relative Humidity
  • XGBoost