پروپوزال پیش بینی تقاضای برق با داده کاوی (docx) 64 صفحه
دسته بندی : تحقیق
نوع فایل : Word (.docx) ( قابل ویرایش و آماده پرینت )
تعداد صفحات: 64 صفحه
قسمتی از متن Word (.docx) :
دانشکدهی آموزشهای الکترونیکی
پاياننامه دوره کارشناسي ارشد در رشتهی مهندسي فناوري اطلاعات (تجارت الکترونیک)
تحلیل و پیشبینی رفتار مصرف برق مشترکین با استفاده از تکنیکهای دادهکاوی
(مطالعه موردی: شرکت توزیع نیروی برق آذربایجان غربی)
به کوشش:
احسان خسرویفر
استاد راهنما:
دکتر بهروز مینایی
تیر 1392
تقدیم به:
با درود به روح بزرگ پدرم و بوسه بر دستان مادرم،
این رساله را به همسرعزیزم ...
که سایه مهربانیش سایهسار زندگیم میباشد، او که اسوه صبر و تحمل بوده و در لحظه لحظههای اجرای این کار تحقیقی، یار و همراهم بود،
تقدیم مینمایم.
سپاسگزاری
سپاس خدای را که سخنوران، در ستودن او بمانند و شمارندگان، شمردن نعمتهای او ندانند و کوشندگان، حق او را گزاردن نتوانند. و سلام و دورد بر محمّد و خاندان پاك او، طاهران معصوم، هم آنان که وجودمان وامدار وجودشان است؛ و نفرين پيوسته بر دشمنان ايشان تا روز رستاخيز . . .
بدون شک جایگاه و منزلت معلم، اجّل از آن است که در مقام قدردانی از زحمات بیشائبهی او، با زبان قاصر و دست ناتوان، چیزی بنگاریم.
اما از آنجایی که تجلیل از معلم، سپاس از انسانی است که هدف و غایت آفرینش را تامین میکند و سلامت امانتهایی را که به دستش سپردهاند، تضمین؛ بر حسب وظیفه و از باب "من لم یشکر المنعم من المخلوقین لم یشکر اللَّه عزّ و جلّ"
از پدر و مادر عزیزم ... این دو معلم بزرگوارم ... که همواره بر کوتاهی و درشتی من، قلم عفو کشیده و کریمانه از کنار غفلتهایم گذشتهاند و در تمام عرصههای زندگی یار و یاوری بیچشمداشت برای من بودهاند؛
از استاد گرامی و بزرگوار، جناب آقای دکتر مینایی که در کمال سعهصدر، با حسنخلق و فروتنی، از هیچ کمکی در این عرصه بر من دریغ ننمودند و زحمت راهنمایی این رساله را بر عهده گرفتند، نهایت تشکر و سپاسگزاری را دارم.
همچنین از اساتید محترم جناب آقای دکتر اقبال منصوری و دکتر محمدهادی صدرالدینی به خاطر راهنماییها و کمکهای ارزندهشان صمیمانه سپاسگزاری مینمایم.
باشد که این خردترین، بخشی از زحمات آنان را سپاس گوید .
چکیده
تحلیل و پیشبینی رفتار مصرف برق مشترکین با استفاده از تکنیکهای دادهکاوی (مطالعه موردی: شرکت توزیع نیروی برق آذربایجان غربی)
به کوشش
احسان خسرویفر
در عصر حاضر به جرات میتوان گفت بشر برای انجام فعالیتهای روزمره و افزایش رفاه زندگی خود، بیش از هر انرژی دیگر از انرژی الکتریکی بهره میبرد. با توجه به مشکل ذخیرهسازی انرژی الکتریکی، پیشبینی میزان بار مورد نیاز به منظور داشتن یک شبکه توزیع برق مطمئن و پایدار حیاتی است. مشترکین برق یکی از اصلیترین ارکان زنجیره عرضه برق میباشند. هدف این تحقیق پیشبینی برق مصرفی مشترکین و تحلیل رفتار مصرفی آنها تحت تاثیر عوامل آبوهوایی و متغیرهای زمانی میباشد. در صورت داشتن یک پیشبینی مناسب و دقیق میتوان از هدررفت منابع مالی ناشی از افزایش هزینههای عملیاتی جلوگیری نمود. از سوی دیگر، با توجه به حجم انبوه دادههای مصرف مشترکین و عوامل موثر، تنها میتوان با استفاده از ابزارهای نوین فنآوری اطلاعات همچون دادهکاوی به تجزیهوتحلیل دادهها پرداخت. ابزار دادهکاوی به استخراج الگوها و دانش پنهان از دادهها جهت یک پیشبینی درست میپردازد.
در این تحقیق، به بررسی و پیشبینی میزان مصرف برق مشترکین شرکت توزیع نیروی برق آذربایجان غربی میپردازیم. برای این منظور و با در اختیار داشتن دادههای مصرفی 5595 مشترک طی 12 دوره دوماهه، الگوریتمهای پیشبینی کننده همچون CHAID، C&R،Regression ،Neural Networks را بر روی دادههای موجود اجرا نموده و نتایج حاصل از اجرای هر الگوریتم بر اساس معیارهای ارزیابی خطای پیشبینی مانند میانگین درصد قدرمطلق خطا مورد بررسی و مقایسه قرار گرفت. نیز با خوشهبندی مشترکین با استفاده از الگوریتم Kohonen به بررسی رفتار مصرفی آنها پرداخته شد. در نهایت، به نتیجهگیری و ارائه پیشنهادات پرداختیم.
کلمات کلیدی: پیشبینی، مصرف برق، مشترک، دادهکاوی، دستهبندی، رگرسیون، خوشهبندی
فهرست
عنوان صفحه
فصل اول: مقدمه و طرح مسئله
1-1- مقدمه . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1-2- بیان مسئله تحقیق . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1-3- ضرورت و اهداف تحقیق . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
1-4- جنبه جدید بودن و نوآوری تحقیق . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1-5- ساختار پایاننامه . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
فصل دوم: مبانی نظری تحقیق
2-1- مقدمه . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2-2- انرژی الکتریکی و اهمیت آن . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2-3- ویژگیهای انرژی الکتریکی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2-4- تاریخچه صنعت برق در جهان و ایران . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2-5- زنجیرهی عرضهی برق . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2-5-1 تولید . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . .16
عنوان صفحه
2-5-2- انتقال . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2-5-3- توزیع . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16
2-5-3-1- مصرف برق در ایران و جهان . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2-5-3-2- مشترک . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2-5-3-2-1- مشترکین بخش خانگی . . . . . . . . . . . . . . . . . . . . . 18
2-5-3-2-2- مشترکین بخش تجاری . . . . . . . . . . . . . . . . . . . . . .19
2-5-3-2-3- مشترکین بخش صنعت . . . . . . . . . . . . . . . . . . . . . .19
2-5-3-2-4- مشترکین بخش عمومی . . . . . . . . . . . . . . . . . . . .. . 19
2-5-3-2-5- مشترکین بخش حملونقل . . . . . . . . . . . . . . . . . . . 20
2-5-3-2-6- مشترکین بخش کشاورزی . . . . . . . . . . . . . . . . . . . .20
2-6 مطالعه و پیشبینی بار . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22
2-6-1- الگوی مصرف . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23
2-6-2- پیشبینی مصرف . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23
2-6-3- عوامل موثر بر مصرف برق . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24
2-6-3-1- شرایط آبوهوایی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2-6-3-2- متغیرهای زمانی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26
2-6-3-3- ویژگیهای محل اقامت مشترک . . . . . . . . . . . . . . . . . . . . . . . . . 27
2-7- دادهکاوی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2-7-1- اهداف دادهکاوی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2-7-2- روشهای دادهکاوی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30
2-7-2-1- دستهبندی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
عنوان صفحه
2-7-2-2- خوشهبندی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31
2-7-2-3- تحلیل وابستگی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31
2-7-3- فرآیند دادهکاوی ( مدل CRISP-DM ) . . . . . . . . . . . . . . . . . . . . . . . . . .32
2-8- چکیده فصل . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34
فصل سوم: مروری بر ادبیات تحقیق
3-1- پیشینه تحقیق . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3-2- چکیده فصل . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41
فصل چهارم: روش تحقیق
4-1- مقدمه . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4-2- فرآیند دادهکاوی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .44
4-3- استاندارد CRISP-DM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4-3-1- مرحله درک تجاری . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4-3-2- مرحله درک دادهها . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46
4-3-3- مرحله پیشپردازش دادهها . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50
4-3-4- مرحله ساختن مدل . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .53
4-3-4-1- الگوریتم C&R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4-3-4-2- الگوریتم CHAID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4-3-4-3- الگوریتم رگرسیون خطی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4-3-4-4- الگوریتم شبکه عصبی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4-3-4-5- الگوریتم کوهونن . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .58
عنوان صفحه
4-3-5- مرحله ارزیابی مدل . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4-3-6- بکارگیری مدل . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .61
4-4- چکیده فصل . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62
فصل پنجم: نتایج و ارزیابی
5-1- مقدمه . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5-2- نتایج . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5-2-1- نتایج حاصل از پیشبینی مصرف برق مشترکین با در نظر گرفتن "تعطیلات" به عنوان عامل موثر . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5-2-2- نتایج حاصل از پیشبینی مصرف برق مشترکین با در نظر گرفتن "میانگین ارتفاع سقف ابر" به عنوان عامل موثر . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66
5-2-3- نتایج حاصل از پیشبینی مصرف برق مشترکین با در نظر گرفتن "کمینه دما و بیشینه دمای موثر" به عنوان عوامل موثر . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .67
5-2-4- نتایج حاصل از پیشبینی مصرف برق مشترکین با در نظر گرفتن "تعطیلات، میانگین ارتفاع سقف ابر، کمینه دما و بیشینه دمای موثر" به عنوان عوامل موثر . . . . . . . . .68
5-2-5- مقایسه عملکرد حالتهای مختلف بر اساس معیار ارزیابی میانگین درصد قدرمطلق خطا . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5-2-6- خوشهبندی رفتار مصرفی مشترکین برق با در نظر گرفتن عوامل موثر . . . . . . .72
5-3- چکیده فصل . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .76
فصل ششم: نتیجهگیری و پیشنهادات
6-1- مقدمه . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .77
6-2- یافتههای تحقیق . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
6-3- پیشنهاد برای تحقیقات آتی. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
منابع . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
فهرست جدولها
عنوان و شماره صفحه
جدول 4-1- اطلاعات کارکرد مشترکین . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46
جدول 4-2- اطلاعات هواشناسی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .48
جدول 5-1- پیشبینی مصرف برق مشترکین با عامل "تعطیلات" . . . . . . . . . . . . . . . . . . .65
جدول 5-2- پیشبینی مصرف برق مشترکین با عامل "میانگین ارتفاع سقف ابر" . . . . . . . .66
جدول 5-3- پیشبینی مصرف برق مشترکین با عوامل "کمینه دما و بیشینه دمای موثر" . 67
جدول 5-4- پیشبینی مصرف برق مشترکین با عوامل "تعطیلات، میانگین ارتفاع سقف ابر، کمینه دما و بیشینه دمای موثر " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
جدول 5-5- خوشههای رفتاری مشترکین برق . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
فهرست شکلها
عنوان صفحه
شکل 2-1- نمودار مصرف برق در جهان در طی سالهای 2000-20009 . . . . . . . . . . . . .17
شکل 2-2- نمودار مصرف برق در ایران در طی سالهای 1383-1389 . . . . . . . . . . . . . . .18
شکل 2-3- درصد انرژی برق مصرفی کشور به تفکیک بخشهای مختلف در سال 1389. . .21
شکل 2-4- درصد مشترکین بخشهای مختلف در سال 1389 . . . . . . . . . . . . . . . . . . . . .21
شکل 2-5- درصد انرژی مصرفی استان آذربایجان غربی به تفکیک بخشهای مختلف در سال 1389 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21
شکل 2-6- درصد مشترکین بخشهای مختلف استان آذربایجان غربی در سال 1389 . . . .21
شکل 2-7- دادهکاوی به عنوان یک مرحله از فرآیند کشف دانش . . . . . . . . . . . . . . . . . . .29
شکل 2-8- مراحل مدل مرجع فرآیند دادهکاوی . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .33
شکل 4-1- ساختار شبکه کوهونن . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .58
شکل 5-1- مقایسه الگوریتمها در پیشبینی مصرف برق مشترکین با عامل "تعطیلات" . . 65
شکل 5-2- مقایسه الگوریتمها در پیشبینی مصرف برق مشترکین با عامل "میانگین ارتفاع سقف ابر" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
شکل 5-3- مقایسه الگوریتمها در پیشبینی مصرف برق مشترکین با عوامل "کمینه دما و بیشینه دمای موثر" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
شکل 5-4- مقایسه الگوریتمها در پیشبینی مصرف برق مشترکین با عوامل "تعطیلات، میانگین ارتفاع سقف ابر، کمینه دما و بیشینه دمای موثر " . . . . . . . . . . . . . . . . . . . . . . 69
شکل 5-5- قسمتی از درخت تصمیم ایجاد شده توسط مدل Kohonen-CHAID . . . . . 70
شکل 5-6- مقادیر میانگین مصرف واقعی و پیشبینی شده توسط مدل Kohonen-CHAID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
شکل 5-7- عملکرد حالتهای مختلف بر اساس معیار ارزیابی میانگین درصد قدرمطلق خطا . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
کلمات اختصاری
Co2 Carbon dioxide
GDP Gross Domestic Product
NI National Income
IEA International Energy Agency
LTF Long-Term Load Forecasting
MTLF Medium-Term Load Forecasting
STLF Short-Term Load Forecasting
CRISP-DM Cross Industry Standard Process for Data Mining
CI Computational Intelligence
C&R Classification & Regression
CHAID Chi-squared Automatic Interaction Detection
SOM Self-Organizing Map
MSE Mean-Square Error
RMSE Root-Mean-Square Error
MAE Mean Absolute Error
MAPE Mean Absolute Percentage Error
فصل اول: مقدمه و طرح مسئله
1-1- مقدمه
انرژي به طور عام و انرژي الکتریکی به صورت خاص، از ارکان مهم رشد و توسعه اقتصادي جوامع میباشد. صنعت برق در اقتصاد ملی و تامین رفاه اقتصادی و اجتماعی کشورها ارزش زیادی دارد و جزء صنایع مهم زیربنایی است. اصولا انرژی الکتریکی تمیزترین و بهترین نوع انرژی است که به آسانی میتوان آن را به هر نقطهای انتقال داد.
تأمین انرژی الکتریکی همواره یکی از نیازهای جوامع پیشرفته کنونی بوده است. با توجه به پیشرفتهای صورت گرفته در حالحاضر تقریبا اکثر فعالیتهای روزمرهی تجاری، پزشکی، صنعتی و ... با استفاده از این انرژی صورت میگیرد. با در نظر گرفتن رشد سریع جوامع، نیاز به تأمین انرژی برق هر چه بیشتر احساس میگردد.
یکی از مسائلی که در این رابطه حتماً باید مدنظر قرار گیرد، زمانبر و هزینهبر بودن ساخت تأسیسات بزرگ تولید و انتقال انرژی الکتریکی میباشد. همین امر لزوم پیشبینی میزان انرژی الکتریکی مورد نیاز در دورههای بعدی را هر چه بیشتر مشخص میکند. بنابراین برای داشتن یک شبکهی قابل اطمینان باید یک دید کلی از مصرف انرژی در دورههای مصرف بعدی داشت و با توجه به آن برنامهریزی ساخت و نصب تجهیزات گوناگون شبکههای تولید، انتقال و توزیع را انجام داد. در این راستا مسألهی برآورد انرژی الکتریکی از اهمیت بالایی برخوردار میباشد که دقیقتر بودن آن به معنی استفاده بهتر از امکانات و جلوگیری از به هدر رفتن سرمایه میباشد .
در ايران نيز با توجه به نيازهاي روزافزون كشور به انرژي و رشد سريع مصرف انرژي، بخصوص انرژي الكتريكي، نياز به مديريت و برنامهريزي مناسب در جهت تامين اين انرژي براي مشتركين از اهميت بالايي برخوردار خواهد بود.
از سوي ديگر با توجه به تاثیر عوامل متعدد و پیچیده بر میزان مصرف انرژی الکتریکی، شناخت این عوامل و بررسی میزان تاثیر هر گروه از عوامل میتواند در تدوین الگوهای مصرف مطلوب کارا باشد. استفاده از روشهای آماری سنتی با توجه به حجم عظیم اطلاعات کارکرد مشترکین و تعدد عوامل موثر بر مصرف در زمینه برآورد انرژی الکتریکی مورد نیاز بسیار دشوار میباشد، بنابراین ابزارهای نوین فنآوری اطلاعات همچون پایگاه داده و دادهکاوی میتواند با پیشبینی دقیق میزان مصرف برق و استخراج الگوها و دانش پنهان در اطلاعات مصرفی مشترکین راهکار مناسبی در زمینهی مدیریت مصرف انرژی الکتریکی باشد.
1-2- بیان مسئله تحقیق
امروزه اهمیت انرژی بر هیچ کسی پوشیده نیست. انرژی در حیات جوامع، نقش زیربنائی را ایفا میکند و به عنوان عامل اصلی هرگونه فعالیتی به شمار میرود. يكي از ويژگيهاي دنياي امروز ، استفاده گسترده از انرژي الكتريكي است. انرژی الکتریکی ما را قادر به استفاده از لوازم الکتریکی از جمله لوازم خانگی، رایانهها، تجهیزات مخابراتی، پزشکی و حملونقل، و همهی آنچه که کیفیت زندگی را افزایش میدهد، میسازد؛ مسلما بسیاری از این لوازم، در زندگی روزمره ضروری و حیاتی میباشند ]6[.
سهولت تبدیل انرژی الکتریکی به سایر انواع انرژی و امکان انتقال سریع آن به نقاط مختلف بر اهمیت استفاده از آن در دنیای مدرن امروزی افزوده وآن را به مهمترین منبع تامین انرژی تبدیل کرده است. این امر موجب گستردگی و مقبولیت استفاده از برق در مصارفی همچون خانگی، تجاری، صنعتی، کشاورزی و سایر مصارف گردیده است. بنابراین سهم و میزان مصرف برق هر یک از بخشهای مصرفکننده از اهمیت ویژهای برخوردار است ]1[. در سراسر جهان، مشترکین خانگی درصد قابل توجهی از مصرف برق را به خود اختصاص میدهند ]7[. در سال 1390، بخش خانگی 9/30% از کل انرژی برق کشور را مصرف نموده و بعد از بخش صنعت در رتبه دوم مصرف انرژی الکتریکی قرار گرفته است ]5[
علیرغم مزایای فراوان، توانایی ذخیرهسازی انرژی الکتریکی وجود ندارد، لذا شناسایی الگوی مستمر عرضه و تقاضا و پیشبینی میزان برق مصرفی مشترکین برای تامین انرژی الکتریکی با قابلیت اطمینان بالا، امری ضروری است ]8[. مصرف انرژی الکتریکی تحت تاثیر عوامل متعددی قرار دارد که از آن جمله میتوان به شرایط آبوهوایی، متغیرهای اقتصادی-اجتماعی، جمعیت، قیمت برق، دورههای تعطیلات و ... اشاره کرد.
بنابراین شناخت الگوهای رفتاری مصرف برق مشترکین برای اتخاذ سیاستهای مناسب به منظور مدیریت پایدار در شبکه برق امری مهم و ضروری است. با توجه به میزان مصرف بالای انرژی الکتریکی در بخش خانگی، پیشبینی صحیح تقاضای انرژی الکتریکی مشترکین خانگی یکی از جنبههای مهم در مدیریت شبکه برق میباشد ]9[. استخراج الگوها و دانش پنهان در اطلاعات مصرفی مشترکین برق و پیشبینی میزان مصرف با توجه به عوامل تاثیرگذار، میتواند برای هر یک از شرکتهای تولید، انتقال و مدیریت توزیع برق کارا باشد. تجزیه و تحلیل دادههای انبوه از مصرف برق مشترکین با استفاده از روشهای آماری سنتی، برای این منظور کارآمد نبوده و به نظر میرسد استفاده از تکنیکهای دادهکاوی میتواند ابزاری راهگشا در جهت پیشبینی و شناخت الگوهای پنهان رفتاری مصرف برق مشترکین باشد]10[.
1-3- ضرورت و اهداف تحقیق
با توسعه سریع اقتصادی و بهبود استاندارد زندگی مردم، تقاضای برق به سرعت در حال رشد است، که این امر نیاز شدید به طرحهای مدیریت منابع برق را ایجاد میکند ]11[. در بازار رقابتی برق، هر یک از شرکتهای توزیع خواهان شناسایی دقیق رفتار مصرف برق مشترکین خود به منظور ارائه خدمات رضایتبخش با حداقل هزینه و داشتن یک سود عادلانه است]12[.
مشترکین برق با الگوهای رفتاری خاص به شبکه برق متصل میشوند. استفاده همزمان مشترکین از وسایل سرمایشی و گرمایشی در فصول مختلف سال و نیز همزمانی انواع مصارف خانگی، روشنایی، عمومی، تجاری، کشاورزی و صنعتی رفتارهای تناوبی مصرف برق را شکل میدهند. از طرفی نیز میزان مصرف مشترکین از عوامل مختلف تاثیر میپذیرند که از جمله عوامل موثر در کوتاهمدت میتوان به شرایط محیطی نظیر دما، رطوبت، پوشش ابر، سرعت باد و ...، و معیارهای زمانی مانند ساعت، روز، هفته، ماه رمضان، تعطیلات جشن و عزا و لحظهی تحویل سال اشاره کرد. اما در بلندمدت عوامل اقتصادی و جمعیتی نیز تاثیر قابل ملاحظهای بر روند مصرف دارند ]1[. بنابراین، تجزیهوتحلیل الگوی مصرف برق مشترکین و برآورد میزان انرژی مصرفی با در نظر گرفتن معیارهای محیطی و زمانی، میبایست از اولویتهای اساسی شرکتهای برق در نظر گرفته شود.
در کشورهای توسعهیافته و در حال توسعه، مدلسازی و پیشبینی مصرف برق نقش حیاتی برای سیاستگذاران و سازمانهای مربوطه دارد. برآورد کمتر از مصرف منجر به قطعیهای بالقوه خواهد شد که این خود نیز باعث ایجاد خلل در زندگی و اقتصاد میگردد. از طرفی دیگر برآورد بیش از نیاز منجر به ایجاد ظرفیتهای غیرضروری خواهد شد که این به معنی منابع مالی هدر رفته است. بنابراین، به منظور جلوگیری از اشتباهات پرهزینه، بهتر است که مصرف انرژی برق را با دقت خوب مدل کرد. تنوع و پیچیدگی در الگوی مصرف برق که ناشی از عوامل متعدد تاثیرگذار بر آن میباشد، منجر به گسترش مدلهای پیچیده شده است. لذا، بهتر است از مدلهایی استفاده شود که بتواند با ویژگی غیرخطی میان متغیرها به عنوان ماهیت مورد انتظار از دادههای مصرف انرژی کار کند ]13[. با توجه به تغییرات مختلف فصلی و ماهانه در مصرف برق و مشکلات در مدلسازی آن با روشهای مرسوم، استفاده از روشهای دادهکاوی مناسبتر به نظر میرسد ]14[.
دلایل قابل توجه دیگری وجود دارد که ضرورت پژوهش در زمینه پیشبینی مصرف برق را نشان میدهد. یکی از این دلایل انتشار گازهای گلخانهای ( دیاکسیدکربن ) است ]15[. بیش از 96% از برق تولید شده در ایران با استفاده از سوختهای فسیلی است که این امر منجر به انتشار حدود 118 میلیون تن گاز CO2 در سال 2009 شده است ]16[. بنابراین به عنوان یکی از راهکارهای کاهش آلودگی هوا، بررسی و شناخت الگوی مصرف مشترکین برق و اتخاذ سیاستهای متناسب با این الگوها میتواند موثر و کارا باشد.
از سوی دیگر، تبادل انرژی الکتریکی میان کشورها، ضمن افزایش بهرهوری موجب دسترسی به بازارها و مراکز جدید مصرف شده، افزایش پایداری و ضریب اطمینان شبکه سراسری را تضمین میکند، و همچنین منجر به استفاده از امکانات کشورهای متعامل در جهت تامین ظرفیت برق و در نتیجه صرفهجویی در سرمایهگذاری و کاهش اعتبارات مورد نیاز برای ایجاد این ظرفیت میگردد. استفاده از مدلهای پیشبینی کنندهی دقیق یک ابزار کلیدی در افزایش تبادل برق میباشد، بهطوری که با بررسی جامع الگوی مصرف مشترکین برق، مبادلات انرژی الکتریکی بسیار مفید و پرسود گردد.
هدف از این تحقیق، پیشبینی میزان مصرف مشترکین برق از طریق بررسی عوامل موثر بر آن و در صورت امکان ارائه الگوی مصرف این مشترکین میباشد. با انجام این پژوهش میتوان به اهداف زیر دست یافت:
شناسایی عوامل تاثیرگذار بر مصرف برق مشترکین و میزان تاثیر آنها.
پیشبینی میزان کارکرد مشترکین با استفاده از الگوریتمهای پیشبینی (ردهبندی) در دورههای آتی.
استفاده از این پیشبینی به منظور کاهش دفعات قرائت کنتور.
خوشهبندی مشترکین بر اساس رفتار مصرفی برق آنها و تحلیل رفتار هر خوشه.
شناسایی میزان تاثیر هر خوشه رفتاری مشترکین بر میزان مصرف کلی.
مطالعات امکانسنجی صرفهجویی انرژی در خوشههای مختلف و اتخاذ سیاستهای متناسب با هر خوشه از جمله ایجاد آییننامه مشترکین و تعرفهها و تبلیغات فراخور.
ایجاد طرح مدیریت پایدار عرضه برق در شبکه.
افزایش نرخ بازگشت سرمایه با کاهش هزینههای ناشی از برآوردهای با دقت پایین از مصرف انرژی.
1-4- جنبه جدید بودن و نوآوری تحقیق
پیشبینی تقاضای برق به عنوان یکی از مهمترین چالشها در مدیریت زنجیره عرضه و تقاضای برق شناخته شده است. الگوی مصرف برق تحت تاثیر برخی از عوامل اجتماعی، اقتصادی و زیست محیطی قرار دارد و در نتیجه این الگو تغییرات پیچیده فصلی، ماهیانه، روزانه و ساعتی را تشکیل میدهد ]8[.
تحقیق در زمینه پیشبینی میزان مصرف انرژی الکتریکی، در سالهای اخیر، توجه گستردهای را به خود جلب کرده است. چندین روش و تکنیک عمده ارائه و توسعه داده شده است، از جمله مدلهای سری زمانی، مدلهای رگرسیون، تابع انتقال باکس جنکینز ، مدلهای سیستم خبره، مدلهای شبکه عصبی و منطق فازی ]8[. بیشتر پژوهشهای انجام گرفته، به پیشبینی میزان برق مصرفی کلی (کشور) در دروههای آتی بر اساس دادههای مصرفی گذشته و با در نظرگرفتن عوامل اقتصادی و جمعیتی پرداختهاند. و بهصورت محدودتر مدلهایی با در نظر گرفتن عوامل آبوهوایی و زیست محیطی و متغیرهای زمانی ارایه شده است. از جمله، چینگ لای به بررسی تاثیر متغیرهای آبوهوایی بر میزان تقاضای ماهیانه برق در انگلستان و ولز کرد. یک مدل رگرسیون چندگانه برای پیشبینی تقاضای ماهیانه برق بر اساس متغیرهای آبوهوایی، تولید ناخالص داخلی، و رشد جمعیت توسعه داده شد ]8[.
نکته قابل توجه این است که تمامی کارهای انجام یافته از منظر مصرف کلی برق ( کشور) در دورههای زمانی مختلف اعم از سال، ماه و ساعت بدون در نظر گرفتن الگوهای رفتار مشترکین پرداختهاند. برخلاف سایر مطالعات این پژوهش رفتار مصرفی مشترکین خانگی را تحت تاثیر عوامل آبوهوایی و متغیرهای زمانی، با استفاده از ابزارها و تکنیکهای نوین اطلاعاتی همچون دادهکاوی، مورد تحلیل قرار داده و با کشف الگوهای پنهان به پیشبینی میزان مصرف برق مشترکین در دورههای آتی میپردازد. مسلم است که با استفاده از الگوهای استخراجی مصرف برق مشترکین، به منظور بهینهسازی و حفظ تعادل عرضه و مصرف انرژی برق اقدامات لازم و جامع را هدفمندتر انجام داد.
1-5- ساختار پایاننامه
در این تحقیق، در نخستین قدم، به شرح مقدمهای کوتاه از پیشبینی مصرف برق و شناخت الگوی مصرف مشترکین، اهمیت و ضرورت پرداختن به آن، و اهداف مورد نظر پرداخته شده است.
در فصل دوم، مفاهیم پیشزمینه و نظری مربوط به صنعت برق مورد بررسی قرار میگیرد. پس از مطالعه منابع موضوع و روشن شدن نیاز موجود به تحلیل الگوی مصرف و پیشبینی بار، اقدام به بررسی و شناسایی عوامل موثر در میزان مصرف برق مشترکین، مینماییم و بدین ترتیب بخش اول از فصل دوم تکمیل میگردد، پس از آن به دلیل استفاده از ابزار دادهکاوی برای پیشبینی مصرف، در بخش دوم این فصل به معرفی تکنیک دادهکاوی و اهداف آن میپردازیم.
در فصل سوم، مروری بر ادبیات گذشته و بررسی مطالعات و پژوهشهای صورت گرفته در خصوص پیشبینی مصرف انرژی برق خواهیم داشت.
در فصل چهارم، فرآیند دادهکاوی بر روی دادههای موجود که شامل دادههای مصرفی مشترکین شرکت توزیع نیروی برق آذربایجانغربی طی 15 دوره از سال 1389 تا سال 1392 و نیز اطلاعات هواشناسی ارومیه طی این مدت زمان به عنوان عامل موثر بر مصرف برق بوده، با هدف پیشبینی میزان مصرف و استخراج الگوهای رفتاری مصرف برق مشترکین با در نظر گرفتن عوامل موثر اجرا شده و نحوه اجرای هر مرحله به صورت گام به گام شرح داده شده است.
در فصل پنجم، نتایج حاصل از بکارگیری روشهای شرح داده شده در فصل چهارم، در قالب جداول و نمودارها ارائه شده و این نتایج ارزیابی و تحلیل شدهاند.
در فصل ششم، نتایجی که در طول پژوهش به دست آمدهاند، در بخش نتیجهگیری فهرست شدهاند و پیشنهاداتی برای پژوهشهای آینده ارائه شده است.
روش تحقیق
4-1- مقدمه
همانگونه که در فصول قبلی مطرح گردید، در سالهای اخیر انرژی الکتریکی با توجه به سهولت تبدیل، سهولت استفاده، کمخطر بودن و همچنین ملاحظات زیستمحیطی بیشتر از سایر انواع انرژی مورد توجه میباشد ]1[. لذا، پیشبینی تقاضای برق به عنوان یکی از مهمترین چالشها در مدیریت عرضه و تقاضای برق شناخته شده است. الگوی مصرف برق متاثر از برخی از عوامل اجتماعی، اقتصادی و محیطی است که توسط آن الگو، تغییرات پیچیدهی مختلف فصلی، ماهیانه، روزانه و ساعتی تشکیل میشود. تنوع و پیچیدگی در الگوی مصرف برق منجر به گسترش مدلهای پیشبینی پیچیدهای و تلاشهای بسیاری برای پیدا کردن بهترین برآورد مصرف برق شده است ]8[. در این میان بیشتر، مصرف انرژی کل کشورها یا منطقهی خاصی مدنظر بوده و مشترکین با توجه به الگوی پیچیدهتر مورد تجزیه و تحلیل قرار نگرفتهاند. طبق گفتههای پیشین، ما در این پژوهش به پیشبینی و تحلیل رفتار مشترکین میپردازیم. که با توجه به عوامل موثر متعدد و حجم گسترده اطلاعات، ابزار دادهکاوی میتواند گزینهی مناسبی باشد. برای استفاده از روشهای دادهکاوی، استاندارد CRISP-DM را برگزیده، و با توجه به اینکه در این فصل بایستی به بیان نظریههای علمی و روش تحقیق بپردازیم، گامهای استفاده از ابزار دادهکاوی بر اساس این استاندارد را تشریح خواهیم نمود.
4-2- فرآیند دادهکاوی
استخراج اطلاعات مناسب از ميان انبوه دادهها و تبديل آنها به دانش مورد نياز سازمانها، بويژه در تصميمگيريهاي سازماني نيازمند استفاده از روشهاي نوين در اين حوزه است. دادهكاوي يكي از اين ابزار و رويكردهاست كه در فضاي مديريت دانش سازمانها به كشف دانش از پایگاه دادهها كمك ميكند. دادهکاوی فرآیندی تحلیلی برای کاوش دادههای انبوه میباشد، که در جستجوی الگوهای سازگار، یا روابط منطقی بین متغیرها است، و سپس به تائید این یافتهها با استفاده از الگوهای تشخیص داده شده میپردازد.
با توجه به ماهيت تحقيق که استفاده از دادهکاوي جهت تعيين و تحليل خصوصيات و رفتارهاي مشترکین برق است؛ پايه اصلي تحقيق حاضر بر کشف دانش از پايگاه داده هاي مورد مطالعه نهاده شده است، از اينرو استاندارد جهاني CRISP-DMجهت انجام فرايند تحقيق مورد استفاده قرار میگیرد.
4-3- استاندارد CRISP-DM
فرايند CRISP-DM يک متدولوژي استاندارد دادهکاوي ميباشد که در اواخر سال 1996 توسط 3 شرکت بزرگ دايملر کرايسلر( بنز)، اس پي اس اس و ان سي آر ايجاد گرديد. اين متدولوژي، يک مدل فرآيندي براي دادهکاوي ارائه ميدهد که مروري بر چرخه عمر هر پروژه دادهکاوي بوده و شامل مراحل متناظر با يک پروژه، وظايف مربوطه و ارتباط بين اين وظايف ميباشد ]27[. گامهاي اين متدولوژي در ادامه بيان شده است.
همانگونه که در فصل دوم اشاره شد، بر اساس استاندارد CRISP-DM، یک فرآیند دادهکاوی شامل شش مرحله میباشد. در حالت مختصر، این شش مرحله شامل درک تجاری، درک دادهها، پیشپردازش دادهها، ساخت مدل، ارزیابی مدل و بکارگیری آن میباشد. با توجه به عدم همکاری سازمانهای مرتبط، این تحقیق تنها در محیط علمی انجام گرفته و معیارهای تجاری در آن کمتر لحاظ شده است. در نتیجه مرحله پایانی فرآیند (بکارگیری) مصداق چندانی در این تحقیق نداشته و اهداف این تحقیق تا مرحله ارزیابی مدل تعریف شده است.
4-3-1- مرحله درک تجاری
اولین مرحله از فرآیند دادهکاوی، مرحله درک تجاری میباشد. این مرحله بر روی فهم اهداف پروژه و پیشنیازهای دورنمای تجاری، سپس تبدیل این دانش به یک مساله دادهکاوی و یک طرح اولیه برای رسیدن به این اهداف، تمرکز دارد ]27[. بدون فهم درست از مساله، هيچ تکنیکی صرفنظر از خبرهبودن آن نميتواند نتيجه مطمئني حاصل نمايد و يا نتايج را به طور صحيح تفسير نمايد. لذا، براي استفاده بهتر از دادهكاوي، بايد يك بيان واضح از هدف خود داشته باشيم.
در نگاه اول، محیط تجاری پژوهش حاضر شرکتهای تولید، انتقال و بالاخص شرکت توزیع نیروی برق به نظر میرسد. اما با توجه به نقش اساسی و حیاتی این انرژی در تمامی ابعاد زندگی امروزه، میتوان محیط تجاری را کل جامعه در نظر گرفت. با توجه به هدف تحقیق که پیشبینی میزان انرژی مورد نیاز است، ما در گام درک تجاری میبایست شناخت مناسبی از مشتریان این صنعت داشته باشیم که برای این منظور در فصل 2 به بررسی زنجیره عرضه برق و مشترکین بخشهای مختلف پرداختیم و با ارائهی آمارهای لازم و نیز بررسی عوامل موثر بر میزان مصرف، درک تجاری موضوع به تفصیل انجام گردید.
یکی از اصلیترین اهداف شرکتهای توزیع برق، افزایش قابلیت اطمینان، پایداری و امنیت شبکه و کیفیت برق با رعایت حقوق مصرفکنندگان است، بهطوری که مدت زمان خاموشیها کاهش یافته و قطعیهای غیر برنامهریزی شده و ناگهانی در شبکه وجود نداشته باشد. در این راستا میتوان با شناسایی عوامل تاثیرگذار بر مصرف برق مشترکین و میزان تاثیر آنها و پیشبینی میزان کارکرد مشترکین در دورههای آتی به یک طرح مدیریت پایدار عرضه برق در شبکه دست یافت.
4-3-2- مرحله درک دادهها
این مرحله شامل جمعآوری دادها برای استفاده از تحلیل اکتشافی و مشخص کردن اطلاعات اولیه برای ارزیابی دادههای با کیفیت و انتخاب دادههای مفید و مورد نیاز میباشد. مرحله درک دادهها با گردآوری دادههای اولیه شروع و سپس با فعالیتهایی از جمله آشنایی با دادهها، یافتن دیدگاه اولیه نسبت به دادهها و ... ادامه مییابد ]27[.
همانطور که در بخش درک تجاری بیان گردید، ما به پیشبینی میزان مصرف برق مشترکین با استفاده از الگوریتمهای پیشبینی کننده تحت تاثیر عوامل محیطی با کمترین میزان خطا جهت دستیابی به اهداف تجاری میپردازیم. برای این منظور ما به جمعآوری دو مجموعه داده شامل پایگاه دادههای کارکرد مشترکین شرکت توزیع نیروی برق آذربایجان غربی و همچنین پایگاه دادههای محیطی شهرستان ارومیه اقدام کردیم.
اطلاعات کارکرد مشترکین
با توجه به حمایت سازمان انرژی بهرهوری ایران از این پژوهش، با انجام مکاتبات لازم با شرکت توزیع نیروی برق آذربایجان غربی پس از مدت طولانی، پایگاه دادهی مربوط به اطلاعات کارکرد مشترکین از ابتدای سال 1389 تا پایان دی ماه 1391 در فرمت Excell و در قالب ذیل دریافت گردید.
جدول 4-1: اطلاعات کارکرد مشترکین
اشتراکدورهتاریخ قرائت فعلیتعداد روزمصرف انرژیمبلغ دورهنوع کنتورواحد اجرایی
توضیحات مربوط به هر فیلد به شرح زیر میباشد:
اشتراک: یک عدد 8 رقمی که برای هر مشترک منحصربفرد میباشد که در اطلاعات دریافتی جهت حفظ حریم خصوصی مشترکین بصورت یک عدد جدید 12 رقمی ارائه گردید.
دوره: بیانگر دورههای مصرف دو ماهه بوده که سالیانه 6 دوره میباشد. در پایگاه دادهی دریافتی اولین دوره مربوط به دوماهه اول سال 1389 و آخرین دوره مربوط به ماههای آذر و دی 1391 است. لازم به ذکر است که پنج دورهی اول قبل از هدفمندی یارانهها میباشد.
تاریخ قرائت فعلی: بیانگر زمان قرائت کنتور برای ثبت کارکرد مشترک در هر دوره میباشد. این تاریخ بر اساس تاریخ شمسی در پایگاه داده ذخیره میگردد.
تعداد روز: مشخصکننده تعداد روزهای مابین قرائت قبلی و قرائت فعلی میباشد که با توجه به دورههای دوماهه، معمولا 60 روز میباشد.
مصرف انرژی: میزان کارکرد هر مشترک بر حسب کیلووات ساعت میباشد.
مبلغ دوره: هزینه مصرف انرژی الکتریکی بر اساس میزان کارکرد و تعرفههای مربوطه میباشد.
نوع کنتور: نشاندهنده نوع کنتور نصب شده در محل مشترک است که به دو نوع تکزمانه و سهزمانه میباشد.
واحد اجرایی: در واقع منطقه برق مشترک از لحاظ شرکت توزیع نیروی برق است.
اطلاعات محیطی
این بخش شامل دو پایگاه دادهی متغیرهای زمانی و اطلاعات آبوهوایی میباشد.
متغیرهای زمانی: ما در این تحقیق از میان متغیرهای زمانی تنها به پارامتر تعطیلات رسمی بسنده کردیم که تعطیلات منطبق با اطلاعات دریافتی گردآوری گردید.
اطلاعات آبوهوایی: برای گردآوری این اطلاعات، علیرغم همکاریهای مناسب سازمان هواشناسی استان، اطلاعات سازمان مربوط به سالهای قبل از 1388 بود که با توجه به اطلاعات کارکرد مشترکین از ابتدای سال 1389، عملا قابل استفاده نبوده است. بنابراین اقدام به خرید اینترنتی از ]53[ نمودیم. لازم به ذکر است اعتبار این دادهها مورد تایید سازمانهای هواشناسی نروژ و ایالات متحده آمریکا میباشد. این پایگاه داده در فرمت Excell بوده و بصورت روزانه از سال 2009 تا 2013 میباشد و شامل فیلدهای زیر است:
جدول 4-2: اطلاعات هواشناسی ]53[
سال به میلادیYear Localماه به میلادیMonth LocalروزDay Localمیانگین ارتفاع سقف ابر بر حسب مترCloud Ceiling (m) / Meanکسری از ساعت که پوشش ابر گزارش نشده است. ]0،1[Cloud Cover Fraction / Fraction Nanکسری از ساعت که هوا صاف گزارش شده است. ]0،1[Cloud Cover Fraction / Fraction Clrکسری از ساعت که هوا کمابر (8/1 پوشش ابر یا کمتر) گزارش شده است. ]0،1[Cloud Cover Fraction / Fraction Fewکسری از ساعت که ابرهای پراکنده (8/2 تا 8/4 پوشش ابر) گزارش شده است. ]0،1[Cloud Cover Fraction / Fraction Sctکسری از ساعت که ابرهای شکسته (8/5 تا 8/7 پوشش ابر) گزارش شده است. ]0،1[Cloud Cover Fraction / Fraction Bknکسری از ساعت که هوا ابری گزارش شده است. ]0،1[Cloud Cover Fraction / Fraction Ovcحداکثر نقطه شبنم در روز (درجه سانتیگراد)Dew Point C / Highحداقل نقطه شبنم در روز (درجه سانتیگراد)Dew Point C / Lowحداکثر رطوبت نسبی در روز ]0،1[Humidity Fraction / Highحداقل رطوبت نسبی در روز ]0،1[Humidity Fraction / Lowمیانگین رطوبت نسبی در روز ]0،1[Humidity Fraction / Meanتعداد گزارشات ساعتی در این روز که بارش پراکنده یا رعدوبرق بوده است.Weather Codes / Precipitation Countتعداد گزارشات ساعتی در این روز که بارش ریز یا نمنم باران بوده است.Weather Codes / Drizzle Countتعداد گزارشات ساعتی در این روز که بارش اندک بوده است.Weather Codes / Rain Slight Countتعداد گزارشات ساعتی در این روز که بارش متوسط بوده است.Weather Codes / Rain Moderate Countتعداد گزارشات ساعتی در این روز که بارش سنگین بوده است.Weather Codes / Rain Heavy Countتعداد گزارشات ساعتی در این روز که برف اندک بوده است.Weather Codes / Snow Slight Countتعداد گزارشات ساعتی در این روز که برف متوسط بوده است.Weather Codes / Snow Moderate Countتعداد گزارشات ساعتی در این روز که برف سنگین بوده است.Weather Codes / Snow Heavy Countتعداد گزارشات ساعتی در این روز که رعدوبرق بوده است.Weather Codes / Thunderstorm Countمتوسط تنظیم ارتفاع سنج Pressure Altimeter (mbar) / Meanمتوسط عمق برفSnow Depth (cm) / Meanبیشینه دمای روزانه (درجه سانتیگراد)Temperature C / Highکمینه دمای روزانه (درجه سانتیگراد)Temperature C / Lowمتوسط قدرت دید (کیلومتر)Visibility (km) / Meanحداکثر سرعت وزش بادWind Speed (m/s) / Highحداقل سرعت وزش بادWind Speed (m/s) / Lowمتوسط سرعت وزش بادWind Speed (m/s) / Mean
مختصری درباره آبوهوای شهرستان ارومیه:
طبق گزارش ایستگاه هواشناسی فرودگاه ارومیه، و با توجه به سوابق تاریخی از سال 2003 تا 2012، ارومیه دارای آبوهوای قارهای با تابستانهای خشک و گرم است.
دما: در طول یک سال، درجه حرارت بهطور معمول از 7- درجه سانتیگراد تا 32 درجه سانتیگراد متغیر بوده و به ندرت به کمتر از 13- درجه سانتیگراد یا بالای 35 درجه سانتیگراد رسیده است.
پوشش ابر: میانگین پوشش ابر در محدوده 16% ( صاف ) تا 62% ( ابری ) قرار دارد. آسمان در 3 بهمن ماه ابریترین و در 24 مرداد صافترین است.
بارش: احتمال بارش در این منطقه در طول سال متغیر است. در کل سال، شایعترین نوع بارش، رعدوبرق، باران متوسط، باران سبک و برف متوسط است.
برف: احتمال بارش برف در 1 بهمن ماه بیشترین است که در 23% از روز اتفاق میافتد. فصلی که در آن احتمال بارش برف بیشترین است، از 10 آذر تا 29 اسفند میباشد.
رطوبت: در طول سال، رطوبت نسبی بهطور معمول از 26% ( خشک ) تا 94% ( بسیار مرطوب ) متغیر است و به ندرت کمتر از 16% ( خشک ) میباشد.
قطره شبنم: در طول سال، نقطه شبنم معمولا از 10- درجه سانتیگراد ( خشک ) تا 16 درجه سانتیگراد ( آرام ) متغیر بوده و به ندرت به کمتر از 16- درجه سانتیگراد ( خشک ) و بیشتر از 18 درجه سانتیگراد ( مرطوب ملایم ) میرسد.
سرعت باد: در طول سال، سرعت باد معمولا از 0 متر بر ثانیه تا 7 متر بر ثانیه ( آرام تا نسیم معتدل ) متغیر است، و به ندرت از 11 متر بر ثانیه ( نسیم قوی ) متجاوز خواهد بود ]54[.
بعد از توضیحات تفصیلی در این بخش دربارهی دادههای تحقیق، میتوان گفت شناسایی اولیه دادهها به خوبی صورت گرفته و با درک کاملی از دادهها پیشپردازش دادهها انجام میگیرد.
4-3-3- مرحله پیشپردازش دادهها
پس از دریافت دادهها، پیشپردازش یا آمادهسازی داده مهمترین گام در فرآیند دادهکاوی است که تاثیر بسیار مهمی بر موفقیت پروژههای دادهکاوی دارد. هدف از گام پیشپردازش دادهها انجام فرایند پاکسازی دادهها برای مقادیر ازدسترفته و دادههای نویزی، کاهش ابعاد و تغییر و تبدیل دادهها در صورت لزوم است ]27[.
بهعبارت دیگر، مرحله آمادهسازي دادهها، شامل کليه فعاليتهايي ميباشد که جهت ساختن مجموعه داده نهايي (دادههايي که براي مدلسازي آماده شدهاند ) از دادههاي خام اوليه بکار ميرود. وظايف آمادهسازي داده احتمالا دفعات متعددي صورت ميگيرد. اين وظايف شامل انتخاب جداول، رکوردها و خصيصهها همچنين انتقال و پاکسازي داده جهت مدلسازي ميباشد.
در این مرحله از تحقیق، پیشپردازش بر روی مجموعه دادههای کارکرد مشترکین، تعطیلات و اطلاعات هواشناسی انجام شد که به شرح ذیل است:
انتخاب داده (کاهش دادهها یا حذف ویژگیهای زائد): ویژگیهای نامتناسب با هدف پژوهش، شناسایی و حذف گردیدند ]27[.
با توجه به دوماهه بودن دورههای مصرف، برای برخی از مشترکین و در برخی دورهها بنا به دلایلی همچون عدم حضور مشترک، کارکرد کنتور در بازهی زمانی مورد نظر ثبت نگردیده، بنابراین با در نظر گرفتن حاشیهی مناسب، دادههای خارج از محدودهی 30 تا 70 روز حذف میگردد.
با توجه به سرانه مصرف 2400 کیلووات ساعت مشترکین در استان آذربایجان غربی، میانگین مصرفهای خارج از محدودهی 2 تا 12 کیلووات ساعت در روز حذف میگردد.
با توجه به تغییرات شدید در میزان مصرف انرژی الکتریکی و الگوی رفتار مصرفی مشترکین قبل و بعد از هدفمندی، جهت دستیابی به نتایج مطلوبتر، اطلاعات مربوط به دورههای قبل از هدفمندی حذف گردید.
فیلد "متوسط عمق برف" به علت داشتن مقادیر خالی فراوان و فیلد "متوسط تنظیم ارتفاعسنج" ابزارهای هواشناسی بدلیل عدم ارتباط منطقی حذف گردید.
به جز فیلدهای تعطیلات، میانگین ارتفاع سقف ابر، کمینه دما و بیشینه دمای موثر، سایر فیلدها به دلیل اینکه در ایجاد مدل و پیشبینی تاثیرگذار نبودند در طی فرآیند تکراری دادهکاوی حذف گردیدند.
پاکسازی داده: این بخش شامل پرکردن و حذف مقادیر خالی، شناسایی و حذف دادههای پرت و اصلاح مقادیر نامعتبر میباشد ]27[.
فیلد "متوسط ارتفاع سقف ابر" در روزهایی که هوا ابری نمیباشد، فاقد مقدار بود که با توجه به هدف تحقیق، با گزینه پیشفرض مناسب در رکوردهای فاقد مقدار جایگذاری شد.
تغییر و تبدیل داده: در این بخش عملیات سازندهی آمادهسازی دادهها مانند تولید فیلدهای مشتقشده از سایر فیلدها، یا تبدیل مقادیر فیلدها و یا ایجاد رکوردهای جدید انجام میگیرد ]27[.
ایجاد فیلد میانگین مصرف که حاصل تقسیم مصرف دوره بر تعداد روز میباشد.
تبدیل تاریخ شمسی قرائت به تاریخ میلادی و ایجاد تاریخ شروع دوره با استفاده از تاریخ قرائت و تعداد روزها.
محاسبه تعداد روزهای تعطیل برای هر مشترک-دوره و میانگین تعطیلات بر اساس تاریخ دوره و جدول تعطیلات و ایجاد فیلدهای مربوطه.
محاسبه و استخراج پارامترهای مربوط به آبوهوای هر مشترک-دوره با استفاده از تاریخ شروع و پایان دوره و نیز اطلاعات روزانه هواشناسی.
ادغام جداول: ادغام جداول همان یکپارچهسازی جداولی است که اطلاعات مختلفی در رابطه با یک شی یکسان دارند.
جداول انتخاب شده از هر سه پایگاه داده بصورت مناسب با یکدیگر ادغام گردیدند.
4-3-4- مرحله ساختن مدل
چهارمین مرحله از استاندارد CRISP-DM، مرحله مدلسازی میباشد. انتخاب و پیادهسازی مناسب دادهکاوی وظیفه اصلی این مرحله است. در عمل چندین مدل به طور همزمان پیادهسازی شده و سپس بهترین آنها انتخاب میشود. شاید بتوان به طور خلاصه گفت که مأموریت اصلی کاوش دادهها به عهدهی این گام است. نوعا براي يک نوع مساله دادهکاوي، چندين تکنيک وجود دارد. بعضي از تکنيکها نيازمند فرمت ويژهاي از دادهها ميباشند. بنابراين بازگشت به مرحله آمادهسازي داده، اغلب مورد نياز است.
با توجه به اینکه یک هدف مساله، انجام پیشبینی است و دادههای موجود از نوع عددی میباشد، بنابراین ماهیت مساله پیشبینی نظارتی میباشد. در این تحقیق نیز از الگوریتمهای مناسب دستهبندی و رگرسیون برای پیشبینی استفاده شده است. از سوی دیگر به منظور تحلیل رفتار مصرف مشترکین، تکنیک خوشهبندی نیز مورد استفاده قرار میگیرد. در ادامه این بخش به شکل مختصر الگوریتمهای بهکار رفته معرفی، و تواناییها و پیشنیازهای هر الگوریتم گفته شده است.
4-3-2-1- الگوریتم C&R:
درخت طبقهبندی و رگرسیون C&R یکی از روشهای پیشبینی و طبقهبندی مبتنی بر درخت تصمیم است. درخت های تصمیم پیشبینی کنندههایی هستند که بر روی یک ویژگی هدف، یک ساختار درختی تشکیل میدهند. گرههای درخت عبارتند از:
گرههای تصمیمگیری: در این گرهها یک مقدار ویژگی برای تعیین شاخهی زیردرخت مناسب امتحان میشود.
گرههای برگ: مقدار ویژگی هدف را تعیین میکنند.
مدل به دست آمده از درخت تصمیم در پیشبینی وضعیت آینده به کار گرفته میشود. درخت تصمیم برخلاف شبکههای عصبی از منطق مناسبتری برای مدل خود برخوردار است و به راحتی از روی گرهها و عمق درخت میتوان به علت تقسیمبندیها پی برد. مهمترین مزیت درختهای تصمیم، ارزان بودن آنها برای ساخت و سرعت بسیار زیاد آنها در پیشبینی نمونههای جدید است و نیز تولید مجموعه قوانین متنی که راحتتر درک میشوند ]47[.
تکنیک C&R با استفاده از تقسیمبندی بازگشتی، سوابق آموزشی را به بخشهای با مقادیر فیلد خروجی مشابه تقسیم میکند. درخت C&R با بررسی فیلدهای ورودی برای یافتن بهترین تقسیم شروع شده، و با کاهش در شاخص ناخالصی حاصل از تقسیم مورد سنجش قرار میگیرد. هر تقسیم به دو زیرگروه شکسته میشود و این فرآیند تا زمانی ادامه مییابد که یکی از معیارهای توقف اتفاق بیافتد. تمامی تقسیمها دودویی ( فقط زیرگروه) میباشند.
در حالت کلی، درختان تصمیم ابتدا رشد یافته و سپس بر اساس یک الگوریتم پیچیدگی هزینه که برآورد ریسک را با توجه به تعداد گرههای پایانی انجام میدهد، هرس میشود. این روش نیز اجازه میدهد تا درخت تصمیم رشد کرده و سپس بر اساس معیارهای پیچیدهتر هرس شود، و یک اعتبارسنجی متقابل بهینه منجر به درختان کوچکتر خواهد شد. افزایش تعداد گرههای پایانی عموما ریسک را برای دادههای موجود (آموزشی) کاهش میدهد، اما ریسک واقعی ممکن است با توسعه مدل به دادههای تست، افزایش یابد. در بدترین حالت، برای هر رکورد در مجموعه آموزشی یک گره پایانی جداگانه تولید خواهد شد. در این حالت، برآورد ریسک برابر با 0% است، چرا که هر رکورد در گره خاص خود میافتد، اما در مقابل ریسک طبقهبندی اشتباه برای دادههای نهان (تست) قطعا بزرگتر از 0 خواهد بود. معیار پیچیدگی هزینه تلاشی برای جبران این مسئله است.
برای آموزش یک مدل درخت C&R، نیاز به یک یا چند فیلد ورودی و دقیقا یک فیلد خروجی است. تمامی فیلدهای پیشبینی کننده و هدف میتوانند بازهای یا دستهای باشند. مدلهای درخت C&R در حضور مشکلاتی از قبیل دادههای از دست رفته و فیلدهای بسیار، کاملا قدرتمند عمل میکند. معمولا برای آموزش نیاز به زمان طولانی ندارند. علاوه بر این، درک این مدلها نسبت به برخی دیگر، آسانتر بوده، و قواعد بهدست آمده از آنها تفسیر بسیار سادهای دارند ]46[.
4-3-4-2- الگوریتم CHAID:
CHAID نوعی از تکنیک درخت تصمیم بر اساس تست اهمیت تنظیم شده است. این تکنیک در سال 1980 توسط گوردن کاس و در آفریقای جنوبی توسعه داده شد. الگوریتم CHAID به منظور پیشبینی ( در حالت مشابه برای تحلیل رگرسیون، که در این حالت CHAID در اصل با عنوان XAID شناخته می شود)، طبقهبندی و همچنین برای تشخیص تعامل بین متغیرها استفاده میشود. در عمل الگوریتم CHAID اغلب در زمینه بازاریابی مستقیم برای انتخاب گروههای مشتریان و پیشبینی نحوه پاسخ آنها تحت تاثیر برخی عوامل به کار میرود، اگر چه کاربردهای اولیه آن در زمینه تحقیقات پزشکی و روانشناسی بوده است. همانند درختهای تصمیم دیگر، مزیت عمده CHAID خروجی بسیار بصری آن است که به آسانی قابل تفسیر و توجیح است ]48[.
الگوریتم CHAID یک روش طبقهبندی آماری برای ساخت درختهای تصمیم با استفاده از مجذور مربعات به منظور شناسایی بهترین تجزیه است. CHAID ابتدا رابطه متقاطع بین هر یک از متغیرهای پیشبینی کننده و متغیر هدف و اهمیت بالقوه هر کدام را با توجه به متغیر هدف و با استفاده از آزمون استقلال مجذور مربع، بررسی میکند. اگر روابط آماری موجود معنیدار بیش از یکی باشد، CHAID مهمترین پیشبینی کننده ( با کوچکترین مقدار p) را انتخاب میکند. اگر یک پیشبینی کننده بیش از دو دسته داشته باشد، مقایسه شده و دستههایی که تفاوتی در نتیجه نداشته باشند با هم ادغام خواهند شد. فرآیند ادغام دستهها زمانی متوقف خواهد شد که تمام دستههای باقیمانده در سطح آزمون مشخصی با یکدیگر تفاوت داشته باشند. برای پیشبینی کنندههای مجموعهای، هر کدام از دستهها با هم ادغام میشوند و برای یک مجموعه ترتیبی، صرفا دستههای پیوسته میتوانند با هم ادغام شوند.
چاید فراگیر یک حالت تغییریافته از الگوریتم چاید است که حالتهای تجزیه ممکن را برای هر پیشبینی کننده بصورت دقیقتر انجام میدهد، اما مدت زمان محاسبهی آن طولانیتر است.
برخلاف الگوریتم درخت C&R، CHAID میتواند درختان غیر دودویی نیز تولید کند، به این معنی که برخی از تجزیهها بیش از دو شاخه دارند. این ویژگی منجر به ایجاد درخت گستردهتر نسبت به روشهای رشد دودویی خواهد شد. CHAID با هر نوع از پیشبینی کنندهها کار میکند و متغیرهای فراوانی و وزندار را میپذیرد. متغیرهای هدف و پیشبینی کننده میتوانند بازهای یا دستهای باشند. متغیرهای ترتیبی، باید به شکل عددی و نه رشتهای ذخیره شده باشند. مقادیر گمشده را با انتساب همهی آنها به یک دسته تکی معتبر، مهار میکند ]46[.
4-3-4-3- الگوریتم رگرسیون خطی:
مدل رگرسیون خطی بهترین برازش معادله خطی را برای پیشبینی فیلد خروجی تخمین میزند. معادلهی رگرسیون نشاندهنده یک خط راست است که مجذور اختلاف بین مقادیر خروجی واقعی و پیشبینی شده را به حداقل میرساند. این روش یک تکنیک آماری بسیار معمول برای خلاصهسازی دادهها و انجام پیشبینی است.
در مدل رگرسیون، فقط فیلدهای عددی استفاده میشود. مدلهای رگرسیون بسیار سریع آموزش میبینند، نسبتا ساده هستند و با یک فرمول ریاضی قابل تفسیر، تولید پیشبینی میکند. از آنجایی که مدل رگرسیون یک روش آماری تثبیت شده است، خواص این مدل به خوبی درک شده است ]46[.
4-3-4-4- الگوریتم شبکهی عصبی:
شبکههای عصبی، مدلهای سادهای از عملکرد دستگاه عصبی هستند. شبکههای عصبی که گاهی به آن ادراکی چند لایه نیز گفته میشود، مدل ساده شدهای از چگونگی پردازش اطلاعات توسط مغز انسان است]45[. عنصر اصلی شبکه عصبی نورونها هستند. یک ابزار ساده مجازی که ورودیهای زیادی را میپذیرد، آنها را جمع میزند، یک تابع تبدیل (معمولا غیرخطی) را بکار میبرد و نتیجه را برای یک مدل پیشگو یا ورودی نورونهای دیگر، تولید میکند. یک شبکه عصبی ساختاری از شمار زیادی نورونهای مشابه است که به شکل منظم به هم متصل شدهاند. شبکههای عصبی استفاده شده در این جا از نوع شبکههای عصبی ارسال رو به جلو هستند. نورونها در این شبکه در لایهها آرایش یافتهاند. معمولا یک لایه برای نورونهای ورودی (لایه ورودی)، یک یا چند لایه از واحدهای پردازش داخلی (لایههای پنهان) و یک لایه برای نورونهای خروجی (لایه خروجی) وجود دارد. هر لایه به شکل کامل با لایههای قبل و بعد خود متصل شده است. برای نمونه در یک شبکه با یک لایه ورودی، یک لایه پنهان و یک لایه خروجی، هر نورون در لایه ورودی به هر نورون لایه پنهان، و هر نورون در لایه پنهان به هر نورون در لایه خروجی متصل است. پیوندهای بین نورونها، مقادیر وزنی وابسته به خودشان را دارند، که قدرت تاثیرگذاری هر نورون را بر دیگر نورونها مشخص میکند. جریان اطلاعات از لایه ورودی به سمت لایه(ها)ی پردازشی و به خروجی، پیشبینی را تولید میکند. با تنظیم مقادیر وزنی پیوندها، هنگام یادگیری به منظور انطباق پیشبینیها با مقدار هدف، شبکه برای تولید پیشبینیهای بهتر و بهتر میآموزد. هیچ نوع محدودیتی برای نوع خصیصهها وجود ندارد. گرههای شبکه عصبی میتوانند ورودی و خروجیهایی از نوع عددی، نمادین و ... را مهار کنند. معمولا پیشبینی شبکههای عصبی حداقل به خوبی روشهای دیگر و گاهی بسیار بهتر است. همچنین برای استفاده از آن به دانش ریاضی و آماری بسیار کمی نیاز است ]46[.
4-3-4-5- الگوریتم کوهونن:
شبکههای کوهونن نوعی از شبکههای عصبی به منظور انجام عمل خوشهبندی هستند و به آنها نقشه خود سازمانده نیز گفته میشود. هنگامی که اطلاعی درباره تعداد گروههای مورد نیاز وجود ندارد، این نوع شبکه مجموعه داده را به گروههای مجزا خوشهبندی میکند. رکوردها به گونهای گروهبندی میشوند که رکوردهای متعلق به یک گروه یا خوشه شبیه به یکدیگر، و رکوردهای متعلق به گروههای مختلف ناهمسان خواهند بود.
در این شبکه، واحدهای اصلی نورونها هستند و به دو لایه سازماندهی شدهاند: لایه ورودی و لایه خروجی ( که این لایه نقشه خروجی نیز نامیده میشود). تمامی نورونهای ورودی به تمام نورونهای خروجی متصل بوده، و این اتصالات دارای وزنهای مرتبط به خود هستند. طی فرآیند آموزش، هر واحد برای "برد" هر رکورد، با واحدهای دیگر رقابت میکند. نقشه خروجی یک شبکه دو بعدی از نورونها بدون هیچ اتصالی بین واحدها است.
شکل زیر ساختار یک شبکه کوهونن را نشان میدهد:
شکل 4-1- ساختار شبکه کوهونن
دادههای ورودی به لایه ورودی ارائه شده، و مقادیر به لایه خروجی انتشار مییابند. نورون خروجی با قویترین پاسخ به عنوان برنده و پاسخ برای ورودی مورد نظر خواهد بود.
در ابتدا، همهی وزنها تصادفی هستند. هنگامی که یک واحد، برنده رکوردی میشود، وزن خود را برای مطابقت بهتر با الگوی مقادیر پیشبینی با رکورد، تنظیم میکند. تمام رکوردهای ورودی ارائه شده و وزنها متناسبا بهروز میشوند. این فرآیند بارها و بارها تکرار میشود تا زمانیکه تغییرات بسیار کوچک باشند. هنگامی که شبکه بهطور کامل آموزش دید، رکوردهای مشابه بایستی در نقشه خروجی نزدیک به هم ظاهر شوند، در حالیکه رکوردهای بسیار متفاوت دور از هم ظاهر خواهند شد.
برخلاف اکثر روشهای یادگیری در کلمنتاین، شبکههای کوهونن از فیلد هدف استفاده نمیکنند. این نوع یادگیری، بدون فیلد هدف، یادگیری بدون نظارت نامیده میشود. به جای تلاش برای پیشبینی نتیجه، شبکههای کوهونن سعی در کشف الگوهای موجود در مجموعه فیلدهای ورودی دارند. معمولا، یک شبکه کوهونن با تعدادی واحد که بیانگر بسیاری از مشاهدات هستند (واحدهای قوی)، و چندین واحد که در اصل با هیچ یک از مشاهدات مطابقت ندارند (واحدهای ضعیف) پایان میپذیرد. واحدهای قوی نشاندهندهی مراکز خوشهها خواهند بود.
در خوشهبندی به روش کوهونن نیازی به دانستن تعداد گروههای مورد نیاز نیست. شبکه کوهونن با تعداد زیادی از واحدها شروع، و با پیشرفت فرآیند آموزش، این واحدها در خوشههای ذاتی موجود در دادهها جذب میشوند. با بررسی تعداد مشاهدات بهدست آمده توسط هر واحد در مدل، میتوان واحدهای قوی را شناسایی نمود، که در واقع تعداد خوشههای مناسب نیز مشخص میشود ]46[.
4-3-5- مرحله ارزیابی مدل
گام آخر از فرآیند دادهکاوی در این تحقیق، ارزیابی مدل میباشد. در این مرحله مدل یا مدلهای که در مدلسازی مورد استفاده قرار گرفتهاند، پیش از استفاده نهایی از نظر کیفیت و دقت و اثربخشی برای اطمینان از توانایی مدل برای دستیابی به اهداف تجاری مساله، مورد آزمون قرار میگیرند. مدلهای دادهکاوی باید به فرآیند تصمیمگیری کمک کنند. بنابراین انتخاب معیارهایی برای سنجش کارایی و مقایسه، ضروری است. در انتخاب معیار، توجه به اهداف تجاری پروژه بسیار مهم است. از جمله معیارهای مهم در ارزیابی مدلهای پیشبینی عددی میتوان به موارد زیر اشاره نمود:
بزرگی حداکثر خطا:
بزرگی حداکثر خطا (MAX) یک معیار خطا برای مقایسهی دقت پیشبینی است. MAX توسط عبارت زیر تعریف میشود:
MAX=maxActi- Pi (1)
که Acti و Pi به ترتیب مقادیر واقعی و پیشبینی شده از میانگین بار مصرفی مشترک iام بوده ، و MAX حداکثر مقدار را نشان میدهد ]41[.
بزرگی حداقل خطا:
بزرگی حداقل خطا (MIN) توسط عبارت زیر تعریف میشود:
MIN=minActi- Pi (2)
که Acti و Pi به ترتیب مقادیر واقعی و پیشبینی شده از میانگین بار مصرفی مشترک iام بوده ، و MIN حداقل مقدار را نشان میدهد.
مربع میانگین خطا (MSE):
MSE = 1Ni=1nActi- Pi2 [18] (3)
مربع مجذور میانگین خطا (RMSE):
RMSE = 1Ni=1nActi- Pi2 [18] (4)
میانگین قدر مطلق خطا(MAE) :
MAE = 1Ni=1nActi- Pi (5)
میانگین درصد قدر مطلق خطا (MAPE):
MAPE توسط عبارت زیر تعریف میشود:
MAPE = 1Ni=1nActi- PiActi ×100 (6)
که Acti و Pi به ترتیب مقادیر واقعی و پیشبینی شده از میانگین بار مصرفی مشترک iام بوده و N برابر با تعداد مشترکین میباشد ]41[.
با توجه به اینکه معیار "میانگین درصد قدرمطلق خطا" برخلاف سایر معیارها، مستقل از مقیاس دادهها میباشد، بنابراین یک معیار مناسب برای ارزیابی خطای نسبی در مسایل گوناگون میباشد.
4-3-6- بکارگیری مدل
ايجاد مدل، عموما پايان پروژه نيست. حتي اگر هدف مدل، ارتقا دانش از دادهها باشد؛ آنگاه دانش حاصل شده نيازمند اينست که سازماندهي شود و به شکلي ارايه گردد که بهرهوران بتوانند از آن استفاده نمايند. بسته به ملزومات کار، فاز بکارگيري ميتواند به سادگي ايجاد يک گزارش باشد يا به پيچيدگي اجراي يک فرايند قابل تکرار دادهکاوي باشد. در بسياري از موارد، اين بهرهوران هستند که گام هاي بکارگيري را انجام ميدهند نه تحليلگران داده. به هر حال حتي اگر تحليلگر، تلاشي براي انجام گامهاي فاز بکارگيري نکند ولي براي بهرهوران بسيار مهم است که عمليات لازم جهت اجرايي نمودن مدل ايجاد شده را درک نمايند. متاسفانه در پژوهش حاضر، بخش تجاری از بکارگیری مدل اجتناب مینماید و در عمل بخش بکارگیری مدل بسیار کمرنگ میباشد.
4-4- چکیده فصل
در این فصل روش تحقیق تشریح گردید. بعد از درک مسئله، به جمعآوري و شناخت دادههای تحقیق بر اساس پايگاه دادههاي شرکت توزیع نیروی برق آذربایجان غربی و اطلاعات هواشناسی, پرداخته شد. در مرحله بعد يکپارچهسازي و آمادهسازي دادهها که به پيشپردازش معروف است، انجام و در نتيجه پايگاه داده اصلي براي اعمال الگوريتمهاي دادهکاوي تعيين شد. و بعد از شناخت الگوريتمهاي پیشبینی کننده دادهکاوي، معیارهای ارزیابی مناسب برای مدلهاي ايجاد شده جهت اعتبارسنجي و در نهایت انتخاب مدل با کمترین خطا و بالاترین دقت بیان گردید.
منابع
]1[ معاونت امور برق و انرژی، دفتر برنامهریزی کلان برق و انرژی، وزارت نیرو. ترازنامه انرژی 1389، (زمستان1390).
]2[ آهویی، محمدحسین (1378). تاثیر گذارترینهای تاریخ: شرح احوال و آثار یکصد نفر از موثرترین شخصیتهای تاریخ جهان. چاپ اول. تهران: انتشارات روزنه.
]3[ مهذب ترابی، سعید. مواخذ قانونی و راهبردهای بهینهسازی مصرف انرژی در کشور. سازمان انرژی بهرهوری ایران (سابا).
]4[ نصیری، نوید (1389). بکارگیری روشهای دادهکاوی در بانکداری الکترونیک برای شناسایی تراکنشهای مالی مشکوک. پایاننامه کارشناسی ارشد، ص 19، قم: دانشگاه قم.
]5[ دفتر فنآوری اطلاعات و آمار، معاونت منابع انسانی و تحقیقات، وزارت نیرو(شهریور ماه 1390). آمار تفصیلی صنعت برق ایران ویژه توزیع نیروی برق در سال 1390. چاپ اول. تهران: انتشارات شرکت مادر تخصصی توانیر.
[6] Dilaver, Zafer; Hunt, Lester C. “Modelling and forecasting Turkish residential electricity demand”, Journal of Energy Policy, Vol. 39: 3117-3127, 2001.
[7] Beccali, M.; Cellura, M.; LoBrano, V.; Marvuglia, A. “Short-term prediction of household electricity consumption: Assessing weather sensitivity in a Mediterranean area”, Journal of Renewable and Sustainable Energy Reviews, Vol. 12: 2040-2065, 2008.
[8] Sadeghi Keyno, H.R.; Ghaderi, F.; Azadeh, A.; Razmi, J. “Forecasting electricity consumption by clustering data in order to decrease the periodic variable’s effects and by simplifying the pattern”, Journal of Energy Conversion and Management, Vol. 50: 829-836, 2009.
[9] Arghira, Nicoleta; Hawarah, Lamis; Ploix, Stéphane; Jacomino, Mireille. “Prediction of appliances energy use in smart homes”, Journal of ENERGY, Vol. 48: 128-134, 2012.
[10] Selbas, Resat; Sencan, Arzu and Kucuksille, Ecir U. “Data Mining Method for Energy System Applications”, Suleyman Demirel University, Turkey:14.
[11] Xu, Minjie; Hu, Zhaoguang; Wu, Junyong; Zhou, Yuhui. “A hybrid society model for simulating residential electricity consumption”, Journal of Electrical Power and Energy Systems, Vol. 30: 569-574, 2008.
[12] Tsekouras, G.J.; Kotoulas, P.B.; Tsirekis, C.D.; Dialynas, E.N.; Hatziargyriou, N.D. “A pattern recognition methodology for evaluation of load profiles and typical days of large electricity customers”, Journal of Electric Power Systems Research, Vol. 78: 1494-1510, 2008.
[13] Kavaklioglu, Kadir; Ceylan, Halim; Ozturk, Harun Kemal; Ersel Canyurt, Olcay. “Modeling and prediction of Turkey’s electricity consumption using Artificial Neural Networks”, Journal of Energy Conversion and Management, Vol. 50: 2719-2727, 2009.
[14] Kheirkhah, A. ; Azadeh, A.; Saberi, M. ; Azaron, A.; Shakouri, H. “Improved Estimation of Electricity Demand Function by Using of Artificial
Neural Network, Principal Component Analysis and Data Envelopment Analysis", Computers & Industrial Engineering, 2012.
[15] Wang, Yuanyuan; Wang, Jianzhou; Zhao, Ge; Dong, Yao. “Application of residual modification approach in seasonal ARIMA for electricity demand forecasting: A case study of China”, Journal of Energy Policy, Vol. 48: 284-294, 2012.
[16] Mazandarani, A.; Mahliaa, T.M.I.; Chonga, W.T.; Moghavvemi, M. “Fuel consumption and emission prediction by Iranian power plants until 2025”, Journal of Renewable and Sustainable Energy Reviews, Vol. 15: 1575-1592, 2011.
[17] Amina, M.; Kodogiannis, V.S.; Petrounias, I.; Tomtsis, D. “A hybrid intelligent approach for the prediction of electricity consumption”, Journal of Electrical Power and Energy Systems, Vol. 43: 99-108, 2012.
[18] Zhu, Suling; Wang, Jianzhou; Zhao, Weigang; Wang, Jujie. “A seasonal hybrid procedure for electricity demand forecasting in China”, Journal of Applied Energy, Vol. 88: 3807-3815, 2011.
[19] Stojanovic, Milos B.; Bozic, Milos M. and Stankovic, Milena M. “Mid-Term Load Forecasting Using Recursive Time Series Prediction Strategy With Support Vector Machines”, Faculty of Electronics Engineering, Vol. 23, No. 3: 287-298, December 2010.
[20] Kavaklioglu, Kadir. “Modeling and prediction of Turkey’s electricity consumption using Support Vector Regression”, Journal of Applied Energy, Vol. 88: 368–375, 2011.
[21] Räsänen, Voukantsis, Niska, Karatzas, Kolehmainen. “Data-based method forcreating electricity use load profiles using large amount of customer-specific hourly measured electricity use data”, Journal of Applied Energy, Vol. 87: 3538–3545, 2010.
[22] Lam, Joseph C.; Wan, Kevin K.W.; Cheung, K.L. “An analysis of climatic influences on chiller plant electricity consumption”, Journal of Applied Energy, Vol. 86: 933–940, 2009.
[23] Hand, David; Mannila, Heikki; Smyth, Padhraic (2001). Principles of Data Mining. ISBN13: 978-0-262-08290-7, The MIT Press.
[24] Tan, Pang-Ning; Steinbach, Michael; Kumar, Vipin (2005). Introduction to Data Mining. 1ST ed., ISBN: 0-321-32136-7, Published by Addison Wesley.
[25] Edelstein, Herbert A. (1999). Introduction to Data Mining and Knowledge Discovery, Third Edition.
[26] Han, Jiawei and Kamber, Micheline (2006). Data Mining Concepts and Techniques, Second Edition.
[27] Chapman et al. (August 2000). CRISP-DM 1.0: Step-by-step data mining guide, SPSS Inc.
[28] Chiang-Lai H., Marmont A., Simon W., Shanti M., “Analysing the impact of weather variable on monthly electricity demand”, IEEE Trams :2078-2085, 2005.
[29] Egelioglu F., Mohamad A.A., Guven H., “Economic variables and electricity consumption in northern Cyprus”, Journal of Energy, Vol. 26: 355-362, 2001.
[30] Azadeh, A.; Saberi, M.; Ghaderi, S.F.; Gitiforouz, A.; Ebrahimipour, V. “Improved estimation of electricity demand function by integration of fuzzy system and datamining approach”, Journal of Energy Conversion and Management, Vol. 49: 2165-2177, 2008.
[31] Azadeh, A.; Ghaderi, S.F.; Sohrabkhani, S. “Forecasting electrical consumption by integration Of Neural Network, time series and ANOVA”, Department of Industrial Engineering and Research Institute of Energy Management and Planning, Faculty of Engineering, University of Tehran.
[32] Azadeh, A.; Tarverdian, S. “Integration of genetic algorithm, computer simulation and design of Experiments for forecasting electrical energy consumption”, Journal of Energy Policy, Vol. 35: 5229–5241, 2007.
[33] Nasr, GE; Badr, EA; Younes, MR. “Neural networks in forecasting electricity energy consumption: Univariate and multivariate approaches”, Int J Energy Res: Vol. 26: 67–78, 2002.
[34] Yuill, W.; Kgokong, R.; Chowdhury, S. “Management of short term load forecasting in South African power networks”, International conference on power system technology (POWERCON): 1–8, 2010.
[35] Kodogiannis, VS; Anagnostakis, EM. “A study of advanced learning algorithms for short-term load forecasting” Eng Appl Artif Intell J, Vol. 44, No. 9: 159–73, 1999.
[36] Santos, PJ; Martins, AG; Pires, AJ; Martins, JF; Mendes, RV. “Short-term load forecast using trend information and process reconstruction”, Int J Energy Res: Vol. 30: 811–22, 2006.
[37] Mohamed, Z.; Bodger, P. “Forecasting electricity consumption in New Zealand using economic and demographic variables”, Journal of Energy, 2003.
[38] Alshareef, Abdulaziz. “Next 24-Hours Load Forecasting for the Western Area of Saudi Arabia Using Artificial Neural Network and Particle Swarm Optimization”, Journal of Engineering and Computer Sciences, Vol. 3, No. 2: 97-117, July 2010.
[39] Geoffrey, K.F. Tso, Kelvin, K.W. Yau, “Predicting electricity energy consumption: A comparison of regression analysis, decision tree and neural networks”, Journal of Energy, Vol. 32: 1761-1768, 2007.
[40] Farroua, Ifigenia; Kolokotroni, Maria; Santamouris, Mat. “A method for energy classification of hotels: A case-study of Greece”, Journal of Energy and Buildings, Vol. 55: 553–562, 2012.
[41] Nagi, Jawad; Siah Yapb, Keem; Nagi, Farrukh; Kiong Tiongb, Sieh; Ahmed, Syed Khaleel. “A computational intelligence scheme for the prediction of the daily peak load”, Journal of Applied Soft Computing , Vol. 11: 4773–4788, 2011.
[42] Ogcu, Gamze; Demirel, Omer F.; Zaim, Selim. “Forecasting Electricity Consumption with Neural Networks and Support Vector Regression”, Journal of Procedia - Social and Behavioral Sciences, Vol. 58: 1576 – 1585, 2012.
[43] Hamzacebi, Coskun. “Forecasting of Turkey’s net electricity energy consumption on sectoral bases”, Journal of Energy Policy, Vol. 35: 2009–2016, 2007.
[44] Azadeh, A.; Ghaderi, S.F.; Sohrabkhani, S. “Annual electricity consumption forecasting by neural network in high energy consuming industrial sectors”, Journal of Energy Conversion and Management, Vol. 49: 2272–2278, 2008.
[45] Tan, Pang-Ning; Michael, Steinbach; Kumar, Vippin. (2005). Introduction to Data Minin. 1ST Edition, ISBN: 0-321-32136-7, Published by Addison Wesley.
[46] (2007). Clementine ® 11.1 User’s Guide. ISBN-13: 978-1-56827-387-7, SPSS Inc.
[47] Rokach, L.; Maimon, O. (2008). Data Mining with Decision Trees: Theory and Applications. World Scientific Publishing.
[48] Antipov, Evgeny; Pokryshevskaya, Elena. “ Applying CHAID for logistic regression diagnostics and classification accuracy improvement”, Journal of Targeting, Measurement and Analysis for Marketing, Vol. 18: 109-117, 2010.
]49[ علیرضا قراباغی، ویژگی های صنعت برق در جهان و ایران، 1386.
[Online]. < http://entecnews.blogsky.com/1386/04/22/post-373>. [5 January 2013]
]50[ شرکت مدیریت تولید برق زنجان، تاریخچه صنعت برق در ایران.
[Online].
. [23 December 2012]
]51[ آمار صنعت برق، شرکت توانیر
[Online] < http://amar.tavanir.org.ir/pages/project/generation/taarif/tozie.php>. [18 September 2012]
[52] IEA, International Energy Agency, Online Data Services.
[Online] . [24 December 2012]
[53] Diebel, James; Norda, Jacob. “Beautiful Weather Graphs and Maps”.
[Online]. < http://weatherspark.com/features_and_help>. [ 1 January 2013]
[54] Diebel, James; Norda, Jacob. “Average Weather For Urmia, Iran”
[Online]. < http://weatherspark.com/averages/32836/Urmia-Azarbayjan-e-Gharbi-Iran>. [ 1 January 2013]
Shiraz University
Faculty of Engineering
M.S. Thesis
In Information Technology Engineering (E-Commerce)
ANALYSIS AND FORECASTING CONSUMPTION BEHAVIOR OF ELECTRICITY CUSTOMERS USING DATA MINING TECHNIQUES
(CASE STUDY: WEST AZARBAIJAN ELECTRICAL DISTRIBUTION COMPANY SUBSCRIBERS)
By:
EHSAN KHOSRAVIFAR
Supervised by:
DR. BEHROUZ MINAEI
June 2013