صفحه محصول - فصل دوم پایان نامه پیش بینی قیمت سهام با داده کاوی

فصل دوم پایان نامه پیش بینی قیمت سهام با داده کاوی (docx) 1 صفحه


دسته بندی : تحقیق

نوع فایل : Word (.docx) ( قابل ویرایش و آماده پرینت )

تعداد صفحات: 1 صفحه

قسمتی از متن Word (.docx) :

دانشکده ي آموزشهاي الکترونيکي پايان نامه کارشناسي ارشد در رشته ي مهندسي فناوري اطلاعات (گرايش مديريت سيستمهاي اطلاعاتي) پيش بيني قيمت سهم در بورس اوراق بهادار به کمک داده کاوي با الگوريتم هاي ترکيبي تکاملي به کوشش محسن نوروزي موحد استاد راهنما دکتر ستار هاشمي ارديبهشت 1394 بسم الله الرحمن الرحيم اظهار نامه اينجانب محسن نوروزي موحد دانشجوي رشته مهندسي فناوري اطلاعات گرايش مديريت سيستمهاي اطلاعاتي دانشکده آموزشهاي الکترونيک اظهار مي نمايم که اين پايان نامه حاصل پژوهش خودم بوده و در جاهايي که از منابع ديگران استفاده کرده ام، نشاني دقيق و مشخصات کامل آن را نوشته ام. همچنين اظهار مي کنم که تحقيق و موضوع پايان نامه ام تکراري نيست و تعهد مي نمايم که بدون مجوز دانشگاه دستاوردهاي آن را منتشر ننموده و يا در اختيار غير قرار ندهم. کليه حقوق اين اثر مطابق با آيين نامه مالکيت فکري و معنوي متعلق به دانشگاه شيراز است. 7025740322400 محسن نوروزي موحد08/02/1394 -1016635-95313500 تقديم به همسر عزيزم، که ارزشمندترين زمان هاي با يکديگر بودن را جهت انجام اين تحقيق سخاوتمندانه به من بخشيد. سپاسگزاري با سپاس از خداوند مهربان به جهت هر آنچه در هر تحقيقي هست، بود و خواهد بود. از پشتيباني استاد راهنما گرامي جناب آقاي دکتر ستار هاشمي و همچنين استاد مشاور عزيز جناب آقاي دکتر حمزه تشکر بسيار داشته و همچون هميشه سپاسگزار و قدردان پدر و مادر دلسوزم که بنيادي ترين هدايت گران من در علم آموزي و پاسخ يابي بوده اند هستم./ چکيده پيش بيني قيمت سهم در بورس اوراق بهادار به کمک داده کاوي با الگوريتم هاي ترکيبي تکاملي به کوشش محسن نوروزي موحد تحقيقات بسياري جهت پيش بيني قابل قبول و قابل اطمينان به کمک روشهاي شبيه سازي، تحليل سري هاي زماني، ترکيب روشهاي هوش مصنوعي با روش هاي تحليل سري هاي زماني و در آخرين آنها ترکيب روشهاي داده کاوي و هوش مصنوعي با روش هاي تحليل سري هاي زماني و الگوريتم هاي بهينه سازي تکاملي در حوزه قيمت سهم در بازار بورس اوراق بهادار صورت گرفته است. در اين تحقيق سعي بر آن شده که در قالب فرايند CRISP داده کاوي و با ارجاع به آخرين تحقيقات صورت گرفته، ترکيب شبکه عصبي مصنوعي و الگوريتم هاي بهينه سازي تکاملي به عنوان مدل پيش بيني قيمت سهم در بازار بورس اوراق بهادار مورد بررسي قرار گيرد. الگوريتم هاي بهينه سازي تکاملي ژنتيک، ازدحام ذرات و رقابت استعماري در آموزش شبکه عصبي مصنوعي با داده هاي سري زماني کاهش يافته قيمت پنج سهم منتخب از بازار بورس اوراق بهادار تهران به کار گرفته شدند و قابل قبول و قابل اطمينان بودن پيش بيني به کمک شبکه عصبي مصنوعي آموزش ديده با الگوريتم ازدحام ذرات بر اساس مقادير شاخص ميزان خطا (mse) پيش بيني شبکه عصبي مصنوعي مورد اشاره به اثبات رسيد. همچنين عدم درک آشوب داده ها توسط الگوريتم يادگيري پيش انتشار خطا به چالش کشيده شد. کلمات کليدي: پيش بيني، داده کاوي، شبکه عصبي مصنوعي، الگوريتم هاي بهينه سازي تکاملي فهرست مطالبعنوانصفحه TOC \o "1-4" \h \z \u فصل 1 : معرفی تحقیق PAGEREF _Toc421202085 \h 11-1 مقدمه PAGEREF _Toc421202086 \h 11-2 تعريف مساله PAGEREF _Toc421202087 \h 21-3 اهميت مساله PAGEREF _Toc421202088 \h 31-4 هدف تحقيق PAGEREF _Toc421202089 \h 41-5 سئوالات تحقيق PAGEREF _Toc421202090 \h 51-6 مفروضات تحقيق PAGEREF _Toc421202091 \h 51-7 دامنه تحقيق PAGEREF _Toc421202092 \h 61-8 ساختار تحقيق PAGEREF _Toc421202093 \h 7فصل 2 : پیشینه تحقیق PAGEREF _Toc421202094 \h 92-1 مدلهاي پيش بيني قيمت سهم در تحقيقات پيشين PAGEREF _Toc421202095 \h 92-2 انتخاب/ استخراج ويژگي در قيمت سهم در تحقيقات پيشين PAGEREF _Toc421202096 \h 16فصل 3 : مبانی نظری تحقیق PAGEREF _Toc421202097 \h 183-1 بازار بورس اوراق بهادار PAGEREF _Toc421202098 \h 183-2 تکنيکهاي رايج تحليل و پيش بيني قيمت سهام PAGEREF _Toc421202099 \h 193-3 تکنيکهاي نوين تحليل داده ها PAGEREF _Toc421202100 \h 203-3-1 داده کاوي PAGEREF _Toc421202101 \h 213-3-2 شبکه عصبي مصنوعي PAGEREF _Toc421202102 \h 26عنوانصفحه3-3-3 الگوريتمهاي تکاملي PAGEREF _Toc421202103 \h 313-3-3-1 الگوريتم ژنتيک PAGEREF _Toc421202104 \h 333-3-3-2 الگوريتم بهينه سازي ازدحام ذرات PAGEREF _Toc421202105 \h 363-3-3-3 الگوريتم رقابت استعماري PAGEREF _Toc421202106 \h 38فصل 4 : روش تحقیق PAGEREF _Toc421202107 \h 434-1 فرايند CRISP PAGEREF _Toc421202108 \h 434-1-1 تعريف مساله PAGEREF _Toc421202109 \h 434-1-2 تحليل داده ها PAGEREF _Toc421202110 \h 434-1-3 آماده سازي داده ها PAGEREF _Toc421202111 \h 444-1-4 مدلسازي PAGEREF _Toc421202112 \h 444-1-5 ارزيابي PAGEREF _Toc421202113 \h 444-1-6 پياده سازي PAGEREF _Toc421202114 \h 45فصل 5 : اجرا PAGEREF _Toc421202115 \h 465-1 اجراي فرايند CRISP PAGEREF _Toc421202116 \h 465-1-1 مجموعه داده ها PAGEREF _Toc421202117 \h 465-1-2 کيفيت داده ها و کاهش داده ها PAGEREF _Toc421202118 \h 505-1-3 پياده سازي شبکه عصبي مصنوعي براي سري هاي زماني PAGEREF _Toc421202119 \h 515-1-3-1 معماري شبکه عصبي مصنوعي PAGEREF _Toc421202120 \h 515-1-3-2 تطبيق ورودي هاي زماني به عنوان ورودي شبکه عصبي مصنوعي PAGEREF _Toc421202121 \h 535-1-4 پياده سازي آموزش شبکه عصبي مصنوعي با الگوريتمهاي تکاملي PAGEREF _Toc421202122 \h 545-1-4-1 الگوريتم ژنتيک PAGEREF _Toc421202123 \h 545-1-4-2 الگوريتم بهينه سازی ازدحام ذرات PAGEREF _Toc421202124 \h 555-1-4-3 الگوريتم رقابت استعماري PAGEREF _Toc421202125 \h 565-1-4 به کارگيري شبکه عصبي مصنوعي آموزش ديده با الگوريتم هاي تکاملي PAGEREF _Toc421202126 \h 58فصل 6 : تحلیل یافته ها، نتیجه گیری و پیشنهاد ها PAGEREF _Toc421202127 \h 606-1 نتيجه گيري و پاسخ به سئوالات تحقيق PAGEREF _Toc421202128 \h 60عنوانصفحه6-2 تحقيقات پيشنهادي آينده PAGEREF _Toc421202129 \h 64فهرست منابع PAGEREF _Toc421202130 \h 65پيوست ها PAGEREF _Toc421202131 \h 67پيوست 1: کد شبکه عصبي سري زماني با آموزش با الگوريتم پيش انتشار خطا PAGEREF _Toc421202132 \h 67پيوست 2: کد شبکه عصبي مصنوعي با آموزش با الگوريتم ژنتيک PAGEREF _Toc421202133 \h 68پيوست 3: کد شبکه عصبي مصنوعي با آموزش با الگوريتم ازدحام ذرات PAGEREF _Toc421202134 \h 71پيوست 4: کد شبکه عصبي مصنوعي با آموزش با الگوريتم رقابت استعماري PAGEREF _Toc421202135 \h 73 فهرست جدول ها عنوانصفحه TOC \h \z \c "جدول شماره " جدول شماره ‏21: مقایسه نتایج پیش بینی مدل بت-عصبی با سه مدل دیگر PAGEREF _Toc421200813 \h 13 جدول شماره ‏22: مقايسه نتايج پيش گويي مدل ارائه شده با مدلهای ديگر PAGEREF _Toc421200814 \h 14 جدول شماره ‏23: نسل بندي روشهاي تحقيق در پيش بيني قيمت سهم PAGEREF _Toc421200815 \h 16 جدول شماره ‏31: شبه کد الگوريتم پيش انتشار خطا PAGEREF _Toc421200816 \h 30 جدول شماره ‏32: شبه کد عمومي الگوريتم هاي تکاملي PAGEREF _Toc421200817 \h 32 جدول شماره ‏33: شبه کد الگوريتم ژنتيک PAGEREF _Toc421200818 \h 34 جدول شماره ‏34 : شبه کد الگوريتم ازدحام ذرات PAGEREF _Toc421200819 \h 37 جدول شماره ‏35 : شبه کد الگوريتم رقابت استعماري PAGEREF _Toc421200820 \h 41 جدول شماره ‏51: نماد سهم هاي انتخاب شده PAGEREF _Toc421200821 \h 46 جدول شماره ‏52: اندازه کاهش يافته داده ها PAGEREF _Toc421200822 \h 51 جدول شماره ‏53: ساختار پياده سازي آموزش شبکه عصبي با الگوريتم ژنتيک PAGEREF _Toc421200823 \h 54 جدول شماره ‏54: ساختار پياده سازي آموزش شبکه عصبي با الگوريتم ازدحام ذرات PAGEREF _Toc421200824 \h 55 جدول شماره ‏55: ساختار پياده سازي آموزش شبکه عصبي با الگوريتم رقابت استعماري PAGEREF _Toc421200825 \h 56 جدول شماره ‏56: نتايج mse شبکه عصبي آموزش ديده با الگوريتم ژنتيک PAGEREF _Toc421200826 \h 58 جدول شماره ‏57: نتايج mse شبکه عصبي آموزش ديده با الگوريتم ازدحام ذرات PAGEREF _Toc421200827 \h 58 جدول شماره ‏58: نتايج mse شبکه عصبي آموزش ديده با الگوريتم رقابت استعماري PAGEREF _Toc421200828 \h 59 جدول شماره ‏59: نتايج mse شبکه عصبي آموزش ديده با الگوريتم پيش انتشار خطا PAGEREF _Toc421200829 \h 59 جدول شماره ‏61: ميانگين و انحراف معيار خطاي اجراهاي ANN و BP PAGEREF _Toc421200830 \h 61 جدول شماره ‏62: نتايج خطاي پيش بيني با ANN و PSO PAGEREF _Toc421200831 \h 63 جدول شماره ‏63: نتايج خطاي پيش بيني با ANN و ICA PAGEREF _Toc421200832 \h 63 فهرست شکل ها عنوانصفحه TOC \h \z \c "شکل شماره " شکل شماره ‏31 : نمونه اي تحليل قيمت سهم با ابزارهاي رويکرد تحليل تکنيکال PAGEREF _Toc421200889 \h 20 شکل شماره ‏32 : فرايند CRISP PAGEREF _Toc421200890 \h 23 شکل شماره ‏33 : ساختار يک نورون PAGEREF _Toc421200891 \h 27 شکل شماره ‏34 : نمونه اي از يک شبکه عصبي مصنوعي با يک لايه پنهان PAGEREF _Toc421200892 \h 28 شکل شماره ‏35 : نمونه نورون در شبکه عصبي مصنوعي پيشرو PAGEREF _Toc421200893 \h 29 شکل شماره ‏36 : فلوچارت عمومي الگوريتم هاي تکاملي PAGEREF _Toc421200894 \h 32 شکل شماره ‏37 : نمايش ترکيب تک نقطه اي PAGEREF _Toc421200895 \h 35 شکل شماره ‏38 : نمايش حرکت ذره در PSO PAGEREF _Toc421200896 \h 36 شکل شماره ‏39: نمايش نمونه اي تقسيم کلوني ها به امپرياليست ها PAGEREF _Toc421200897 \h 40 شکل شماره ‏310: حرکت خطي کلوني PAGEREF _Toc421200898 \h 41 شکل شماره ‏311: حرکت زاويه اي کلوني PAGEREF _Toc421200899 \h 41 شکل شماره ‏51 : نمودار قيمت روزانه سهام نماد بکام PAGEREF _Toc421200900 \h 48 شکل شماره ‏52 : نمودار قيمت روزانه سهام نماد وپارس PAGEREF _Toc421200901 \h 48 شکل شماره ‏53 : نمودار قيمت روزانه سهام نماد وغدير PAGEREF _Toc421200902 \h 49 شکل شماره ‏54 : نمودار قيمت روزانه سهام نماد خودرو PAGEREF _Toc421200903 \h 49 شکل شماره ‏55 : نمودار قيمت روزانه سهام نماد رانفور PAGEREF _Toc421200904 \h 50 شکل شماره ‏56 : شبکه عصبي مصنوعي با داده هاي سري زماني PAGEREF _Toc421200905 \h 53 شکل شماره ‏61 : تابع احتمال تجمعي توزيع نرمال برازش شده خطا PAGEREF _Toc421200906 \h 61 شکل شماره ‏62 : تابع احتمال تجمعي توزيع نرمال برازش شده خطا ANN و EAs PAGEREF _Toc421200907 \h 62 : معرفی تحقیق 1-1 مقدمه بشر در دنياي امروزي به صورت روزمره در بازارهاي گوناگون درگير تصميم گيري هاي بيشماري بوده و هر گونه پيشنهادي که امکان بهبود دقت و صحت تصميم و يا کاهش زمان تصميم گيري را براي او به ارمغان بياورد براي وي جذاب و ارزشمند مي باشد. يکي از بازارهايي که امروزه رو به رونق بوده و مزاياي سيستمهاي پشتيبان تصميم گيري در آن بسيار مشهود مي باشد بازارهاي پولي و سرمايه شامل بازار بورس اوراق بهادار مي باشد. فعالان اين بازار به خريد و فروش سهام شرکتها در آن بازار پرداخته و از آن طريق با پذيرفتن ريسکِ آينده سهم براي خود سود و يا زيان به بار مي آورند. در اين تحقيق سعي خواهد شد تا با به کارگرفتن تکنيکهاي داده کاوي شناخته شده، در مسير تحقيقات صورت گرفته پيشين، ترکيبي از الگوريتم شبکه عصبي مصنوعي با الگوريتمهاي بهينه سازي تکاملي به منظور پيش بيني قيمت سهام شرکتها در بورس اوراق بهادار ارائه گردد. ترکيب الگوريتم شبکه عصبي مصنوعي با سه الگوريتم بهينه سازي تکاملي ژنتيک، رقابت استعماري و ازدحام ذرات روي حداقل پنج سهم مورد بررسي قرار خواهد گرفت و دقت پيش بيني هر يک محاسبه و ارائه خواهد گرديد. خروجي اين تحقيق، پيشنهاد بهترين الگوريتم ترکيبي از بين موارد ذکر شده براي پيش بيني قيمت سهام شرکتهاي عضو بورس اوراق بهادار خواهد بود. 1-2 تعريف مساله در بازارهاي پولي و سرمايه دو نوع تکنيک اساسي براي تحليل و تصميم به خريد و يا فروش سهام شرکتها وجود دارد: تکنيک تحليل بنيادي، تکنيک تحليل تکنيکي. در تحليل بنيادي، از مولفه هاي اصلي عملکرد و توان شرکت در برابر فرصتها و تهديدهاي بازار و در سطح کلان کشور استفاده شده و در مورد خريد و يا فروش آن سهم تصميم گيري مي شود. در برابر در تحليل تکنيکي، فرض بر آن است که اثر کليه عوامل کلان و خرد اقتصادي و نيز توان و عملکرد شرکت در پيشينه تاريخي قيمت سهم وجود داشته و در نتيجه با تحليل روند قيمت سهم، تصميم به خريد و يا فروش سهم شرکتي گرفته مي شود. پيش بيني و يا پيش گويي قيمت سهم شرکتها در بازارهاي اوراق بهادار از مسائلي است که تحقيقات گوناگوني در کشورهاي مختلف در مورد آن صورت گرفته است. اين تحقيق در بازار بورس اوراق بهادار تهران و تحت رويکرد تکنيک تحليل تکنيکي سعي خواهد نمود تا به حل مساله پيش بيني قيمت سهم شرکتها پرداخته و پاسخي به نياز فعالان بورس اوراق بهادار در مورد حل مساله پيش بيني قيمت سهم ارائه نمايد. 1-3 اهميت مساله اندازه بازار بورس اوراق بهادار تهران در حوزه معملات سهام بيش از 523’342 ميليارد تومان است. اهميت اين اندازه بازار در مقايسه با بودجه ي حدود 000’800 ميليارد توماني سال 1393 کشور بسيار مشهود مي باشد. بازار بورس اوراق بهادار جزء پنج بازار اصلي سرمايه اي کشور است که کوچکترين نوسانات عملياتي آن اثرات بسياري در اقتصاد کشور خواهد گذاشت. در اين بازار بيش از 450 شرکت سرمايه پذير در قالب 35 صنعت به عرضه سهام پرداخته اند و معامله گران حقوقي و حقيقي بيشماري از محل تجارت سهام شرکتها در اين بازار به مديريت اقتصاد بنگاه ها و خانوار مي پردازند. در شرايط ثبات اقتصادي کشورها، سود حاصل از فعاليت در بازار بورس از سود بهره بانکي قطعا بالاتر بوده و اين جذابيت سبب مي شود در شرايط ثبات و يا رشد اقتصادي کشور، جريان سرمايه از بسياري از بازارها و همچنين جريان سرمايه هاي راکد و يا فعال در بازارهاي سياه به سمت بازار بورس اوراق بهادار باشد. در کنار نگاه اقتصادي به بازار بورس، از نگاه اجتماعي نيز حضور معامله گران در سنين جواني و يا پايان ميان سالي، يعني دقيقا در سنيني که هيجان ريسک پذيري، انگيزه فعاليتهاي پرچالش و توام با ريسک را به همراه دارد، در اين بازار شايان توجه است. از اين منظر انتظار آن خواهد بود که در صورت وجود موج اخبار رونق و بازدهي قابل قبول اين بازار، نسبت عمده اي از جمعيت جوياي کار در اين بازار به صورت مستقل به اشتغال درآيند. با اين توضيحات، مي توان نتيجه گرفت حل مساله اين تحقيق با ارائه مدلي بابت پيشگويي قابل اعتماد قيمت سهم شرکتها در بازار بورس داراي نه تنها اهميت از منظر اقتصادي بلکه در زمره مسائل با اهميت اجتماعي نيز قرار مي گيرد. 1-4 هدف تحقيق همانگونه که در بخشهاي پيشين اشاره شد مساله مورد تحقيق، يشگويي قيمت سهام شرکتها در بازار بورس اوراق بهادار مي باشد. تکنيکهاي متعدد تحليل داده ها سعي در ارائه مدلهايي در پاسخ به سئوال اين تحقيق نموده اند. دانش نوين داده کاوي با ساختاردهي بسياري از اين تکنيکها، محققان را در پيشبرد بهبود کارايي و اثربخشي مدلها و راهکارها کمک شاياني نموده است. در اين تحقيق با مرور تحقيقات پيشين، به کارگيري مدل شبکه عصبي مصنوعي با آموزش به کمک الگوريتمهاي تکاملي مد نظر قرار گرفته است. هدف بنيادين اين تحقيق شناسايي اثربخش ترين مدل پيشگويي قيمت سهام شرکتهاي فعال در بازار بورس اوراق بهادار، ساخت يافته با شبکه عصبي مصنوعي آموزش داده شده با الگوريتم تکاملي مي باشد. به منظور دستيابي به اين هدف، اهداف خرد و يا نشانه ها به شرح زير مد نظر مي باشد: شناسايي الگوريتمهاي ترکيبي از شبکه عصبي مصنوعي با الگوريتمهاي بهينه سازي بر اساس تحقيقات گذشته دستيابي به اطلاعات معتبر و صحه گذاري شده قيمت روزانه سهام شرکتهاي عضو در بورس اوراق بهادار پياده سازي الگوريتمها روي داده هاي سهم حداقل پنج شرکت عضو بورس اوراق بهادار مقايسه دقت الگوريتم ها و پيشنهاد الگوريتم با بهترين دقت 1-5 سئوالات تحقيق اين تحقيق، تحقيقي نظري است که در آن در سعي بر آن شده است تا پاسخ سئوال زير به عنوان سئوال اصلي تحقيق يافته شود: "از بين مدل هاي شبکه عصبي مصنوعي آموزش داده شده با الگوريتمهاي تکاملي رايج در پيش بيني قيمت سهم کداميک با بهترين دقت پيش بيني قيمت سهم شرکتها در بورس اوراق بهادار تهران را انجام مي دهد؟" به منظور پاسخ گويي به سئوال فوق در مراحل تحقيق به سئوالات زير به عنوان سئوالات فرعي تحقيق پاسخ داده مي شود: داده هاي بورس اوراق بهادار چگونه ذخيره سازي و توزيع مي شوند و مي توان به آنها دسترسي پيدا کرد؟ ترکيب شبکه عصبي مصنوعي با الگوريتمهاي بهينه سازي تکاملي به چه صورت پياده سازي مي گردد؟ آيا داده کاوي با الگوريتمهاي ترکيبي شبکه عصبي مصنوعي و الگوريتمهاي بهينه سازي تکاملي قادر به ارائه پاسخ قابل قبول و قابل اطميناني در پيش بيني قيمت سهم مي باشد؟ 1-6 مفروضات تحقيق اگر چه در اين تحقيق سعي بر آن شده تا با محدودسازي بيهوده از کيفيت محتواي تحقيق کاسته نگردد لکن برخي مفروضات بر به شرح موارد زير بر اين تحقيق وارد مي باشند: اثرات کليه عوامل تاثيرگذار بر قيمت سهام شرکت در بازار بورس اوراق بهادار در ذات قيمت سهام در دوره هاي گذشته وجود داشته و نيازي به در نظر گرفتن عوامل ديگر در پيش بيني قيمت آينده سهم نمي باشد. به عبارت ديگر، تکنيک تحليل سهم پشتيبان در اين تحقيق مبتني بر رويکرد تکنيکال مي باشد. نتايج پيش بيني قيمت پنج سهم مورد مطالعه، قابل تعميم به جامعه سهام شرکتها در بورس اوراق بهادار مي باشد. بر اساس تحقيقات پيشين از بين الگوريتمهاي تکاملي رايج دو الگوريتم ژنتيک و بهينه سازي ازدحام ذرات انتخاب شده و الگوريتم رقابت استعماري به دليل جديدتر بودن و انجام کمترين تحقيقات در اين حوزه مد نظر قرار گرفته است. انتخاب/ استخراج ويژگي در سري زماني قيمت سهام هر شرکت بر اساس نتايج تحقيقات گذشته صورت مي گيرد و در اين تحقيق فعاليت افزوده اي بر فعاليتهاي پيشين به غير از کاهش اندازه داده ها بر اساس نتايج انتخاب/استخراج ويژگي در تحقيقات گذشته صورت نمي گيرد. 1-7 دامنه تحقيق اين تحقيق به گونه اي انجام گرفته است که نتايج آن قابل تسري به کليه مسائل مشابه باشد. در اجراي اين تحقيق برخي محدوديهاي کوچک به واسطه زمان محدود تحقيق و محدوديت منابع، منجر به محدودسازي دامنه مساله و تحقيق گرديده است. موارد زير عوامل محدودکننده دامنه اين تحقيق مي باشند: نمونه مورد بررسي تعداد پنج سهم از بين بيش از چهارصد و پنجاه سهم در بازار بورس اوراق بهادار تهران مي باشد. بر اساس محاسبات تئوريک آماري تعداد نمونه بيشتري از چهارصد و پنجاه سهم موجود براي رسيدن به سطح اطمينان 90% نياز مي باشد ولي با در نظر گرفتن تشابه بسيار زياد رفتار قيمت سهام مختلف در يک صنعت و با در نظر گيري تعداد سي و پنج صنعت فعال در بورس اوراق بهادار تعداد پنج سهم به عنوان نمونه قابل قبول در سطح 95% اطمينان مي باشد. توان محاسباتي نرم افزار مورد استفاده که در اين تحقيق نرم افزار MATLAB مي باشد يکي ديگر از موارد مورد توجه مي باشد. اين نرم افزار بسيار قدرتمند در انجام محاسبات، توان محدودي نسبت به برخي نرم افزارهاي موجود مانند R در راندمان محاسبات و فضاي مورد نياز دارد. اين مورد اثري در محاسبات و نتايج اين تحقيق ايجاد ننموده لکن امکان محاسبات همزمان تعداد نمونه بيشتر را با محدوديت مواجه مي نمايد. 1-8 ساختار تحقيق اين تحقيق شامل شش فصل مي باشد. در فصل اول مساله تحقيق معرفي مي گردد و سئوالات اصلي و فرعي تحقيق به همراه مفروضات و دامنه تحقيق تشريح مي گردد. تحقيقات پيشين در فصل دوم مرور شده اند. در اين فصل مرور تحقيقات داده کاوي روي الگوريتمهاي ترکيبي شبکه عصبي مصنوعي و الگوريتمهاي ديگر مورد توجه قرار گرفته و در اين بين الگوريتمهاي بهينه سازي تکاملي کانون توجه بوده اند. همچنين در اين فصل نتايج تحقيقات گذشته در شناسايي/ انتخاب ويژگي در داده هاي قيمت سهام مورد بررسي قرار گرفته است. فصل سوم اين تحقيق حاوي مباني نظري تحقيق مي باشد. در اين فصل پس از شرحي بر بازار بورس اوراق بهادار و رويکردهاي رايج تحليل قيمت سهام در آن بازار به تشريح نظري داده کاوي، شبکه هاي عصبي مصنوعي و الگوريتمهاي تکاملي انتخاب شده پرداخته شده است. روش تحقيق به کار گرفته شده، در فصل چهارم اين گزارش شرح داده شده است. نتايج اجراي تحقيق بر اساس روش تحقيق شرح داده شده در فصل پنجم گزارش گرديده است و فصل ششم، تحليل و نتيجه گيري اجراي تحقيق را در کنار پيشنهاد تحقيقات آينده ارائه مي نمايد. : پیشینه تحقیق 2-1 مدلهاي پيش بيني قيمت سهم در تحقيقات پيشين محققان بسياري سعي نموده اند تا با به کارگيري روشهاي گوناگون پيش بيني به نتايج قابل قبولي در پيش بيني قيمت سهام در بازارهاي پول و سرمايه دست يابند. سير تحقيقات نشان دهنده آن است که از مدلهاي ساده و تک بعدي ابتدايي، روشها به سمت مدلهاي روشهاي زماني، مدلهاي بهينه سازي کلاسيک، روشهاي هوش مصنوعي و روشهاي ترکيبي حاصل از ترکيب انواع مدلهاي اشاره شده حرکت نموده اند. در مواردي روشهاي مبتني بر تحليل سري هاي زماني مانند الگوريتم هموارسازي نمايي و يا تحليل روند مورد استفاده قرار گرفته اند. تحقيقات متعددي با هدف پيش بيني قيمت سهام شرکتها در بازارهاي پول و سرمايه با روشهاي مختلفداده کاوي صورت گرفته است. بسياري تحقيقات بر اساس به کارگيري شبکه عصبي مصنوعي شکل گرفته اند و محققان به اشکال گوناگون به بررسي کارايي آن الگوريتم پرداخته اند. در تحقيقي CITATION WuM13 \l 1065 [1] از شبکه عصبي پيشرو به منظور پيش گويي قيمت سهام استفاده نموده اند. در اين تحقيق، به کمک فرايند داده کاوي يکپارچه، داده هاي انتخاب، نمونه داده ها، تبديل داده ها، مدلسازي شبکه، شبيه سازي شبکه و ارزيابي نتايج به دست آمده، پيش گويي روند شاخص کل بازار بوري شانگهاي با دقت بالاتري به دست آمد. نتيجه اين تحقيق، مزيت استفاده از شبکه عصبي پيشرو با يادگيري پيش انتشار را در پيش گويي سيستمهاي غيرخطي نشان داد. همچنين در تحقيق ديگري CITATION مسع \l 1065 [2] به مطالعه تجربي بر روي يك شبكه عصبي مصنوعي، كه حاصل تجارب پياده سازي مدل انتشار – بازگشتي پيش بيني قيمت سهام است را گزارش مي دهد پرداختند. در راستاي آزمون قابليتهاي پيش بيني شبكه عصبي، مدل انتشار – بازگشتي براي پيش بيني قيمت سهام ايجاد گرديد. پارامترهاي اين نوع شبكه تغيير داده شد و نتايج پيش بيني ثبت گرديد. اين پارامترها عبارت بودند از : الگوريتم يادگيري، بازه نگاه به گذشته، تعداد نورون ها در لايه پنهان و توابع فعال ساز كه اثرات تغييرات آنها در اين مقاله موردمطالعه قرار گرفت . در انتها نتايج پياده سازي مدل روي سهام سه شركت مختلف به همراه پارامترهاي آن نشان داده شده است. در اين مطالعه سهام سه كمپاني SPG, WMT, IBM در بازار سهام نيويورك از سال 2004 تا 2007 به عنوان ورودي شبكه عصبي مورد مطالعه قرار گرفت . از ميان داده ها قيمت حداکثر و حداقل براي هر ماه مد نظر بوده است. براي آموزش مدل داده ها از ماه دوم سال 2004 تا ماه اول سال 2006 استخراج شدند. كه از 60 درصد از اين داده براي آموزش و از 40 درصد ديگر به عنوان آزموني براي تشخيص توانائي پيش بيني مدل استفاده شده است. در ادامه براي تعيين ميزان سود حاصله قيمت حداکثر و حداقل دوازده ماه (از ماه دوم سال 2006 تا ماه اول سال 2007) به شبكه داده شد. هدف يا خروجي شبكه پيش بيني قيمت حداکثر و حداقل سهام در ماه بعد مي باشد. ANN استفاده شده داراي سه لايه (لايه پنهان ، لايه ورودي و لايه خروجي) مدل آموزش پيش انتشار خطا، تعداد نورون هاي ورودي برابر با اندازه بازه ضربدر 2 و تعداد نورون هاي خروجي برابر با 2 (حداکثر و حداقل) مي باشد. در انتهاي اين مقاله نتايج بدست آمده از شبكه پياده سازي شده، شامل قيمتهاي واقعي،پيش بيني شده همراه با نمودار عملكرد شبكه در فرايند آموزش به ازاي قيمتهاي حداکثر و حداقل نشان داده شده است. اخيرا محققان به ترکيب الگوريتمهاي مختلف به منظور بهبود کارايي و دقت در پيش بيني ها مشغول شده اند و نتايج مناسبي نيز به دست آورده اند. تحقيق ديگري CITATION پیا89 \l 1065 [3] به ارائه مدلي تركيبي از شبكه هاي عصبي مصنوعي، با هدف بررسي توان پيش بيني كنندگي آنها در مقايسه با مدلهاي منفرد پرداختند. در اين بررسي، با استفاده از شبكه هاي عصبي، تركيبي متشكل از شبكه هاي پيشخور و كوهونن اقدام به پيش بيني قيمت سهام شده است. نتايج آزمايشات محاسباتي در شبکه عصبي خودسازمانده پيش بيني قيمت سهام در بازار بورس تهران نشان داد كه تركيب شبكه خودسازمانده كوهونن با شبكه پيشخور، در مقايسه با مدل منفرد شبكه پيشخور كه پركاربردترين مدل شبكه هاي عصبي مصنوعي در حوزه پيش بيني بود، عملكرد بهتري در پيشبيني قيمت سهام ارائه ميكند. گروهي از الگوريتمهاي ترکيبي الگوريتمهايي هستند که از ترکيب شبکه عصبي مصنوعي با يکي از الگوريتمهاي بهينه سازي تکاملي شکل مي گيرند. به دليل جديد بودن اين زمينه، تحقيقات متععدي روي آن صورت نگرفته است لکن موارد محدود موجود نشان دهنده کارايي و دقت قابل قبول براي پيش بيني در بازار بورس اوراق بهادار مي باشد. محققان ديگري CITATION Deb13 \l 1065 [4] عنوان نموده اند به کارگيري روشهاي سنتي، قابليت اطمينان پيش گويي ها در بازار سهام را تضمين نمي نمايند. ايشان شبکه عصبي مصنوعي را به منظور استخراج اطلاعات از داده هاي حجيم و داده کاوي را به منظور پيش گويي روندها و رفتار در بازارهاي سهام مناسب يافتند و با ترکيب اين دو به مدلي دست يافتند که در خروجي، پيش گويي هايي با قابليت اطمينان مطلوبتر ارائه مي نمود. در تحقيقي CITATION Jia13 \l 1065 [5] محققان براي پيشگويي روند قيمت سهام شرکتها، قيمت سهام را تحت تاثير عوامل بيروني اقتصادي و شاخصهاي مالي شرکت دانسته و به منظور تعيين روند قيمت آن از روش خوشه بندي فازي (روشي ترکيبي) استفاده نمودند. در خوشه بندي، نمونه ها با توجه به فاصله آنها با يکديگر و يا به عبارت ديگر بر اساس ميزان نزديکي و مشابهت تقسيم مي شوند و خوشه ها را شکل مي دهند. در خوشه بندي کلاسيک هر نمونه فقط و فقط مي تواند عضو يک خوشه باشد لکن در خوشه بندي فازي با توجه به مفهوم مجموعه هاي فازي هر نمونه مي تواند به بيش از يک خوشه نيز تعلق داشته باشد. استفاده از اين روش به محققان اين امکان را داده تا قطعيت قضاوت در مورد روند قيمت يک سهم را افزايش دهند و در مواردي که نمونه اي بسيار مشابهت به نمونه هاي مثلا دو خوشه را دارد آن را در هر دو خوشه در نظر بگيرد. اين حالت در مورد قيمت سهام بروز مي نمايد و يکي از منابع تصميمات اشتباه تحليل گران بازار سهام را شکل مي دهد. الگوريتم مورد نظر در مورد داده هاي قيمت سهم ده شرکت مخابراتي با در نظر گرفتن نه شاخص مالي شامل دارايي خالص به ازاي هر سهم، عايدي به ازاي هر سهم، سرمايه تجمعي به ازاي هر سهم، نرخ سود ناخالص به ازاي هر سهم، نسبت سود عملياتي، نسبت سود خالص، بازگشت وزني سرمايه، بازگشت خفيف سرمايه و نسبت جاري به کار گرفته شد. نتايج آزمون انجام شده نشان داد که در مواردي که شاخصهاي مالي شرکتها در يک خوشه قرار مي گيرند قيمت سهام شرکتها مشابهت زيادي خواهند داشت و مي توان روند آن را پيش گويي نمود. مثلا دو شرکت اول و نهم در آزمون مذکور در يک خوشه قرار گرفت. با کاهش ضريب لاندا شرکت ششم نيز در خوشه اول قرار گرفت و قابل پيشگويي نمود که قيمت سهم آن به سمت قيمت سهم دو شرکت اول و نهم کاهش يابد. در تحقيق ديگري CITATION رضا92 \l 1065 [6] مشکل وجود شرايط متعدد آشوب و رفتار غير خطي در بازار سهام و بالتبع قيمت سهام شرکتها را مورد توجه قرار داده و سعي نمودند تا با کمک يک الگوريتم ترکيبي بر اين مشکل واقعي بازار سهام که الگوريتمهاي کلاسيک قبلي قادر به مواجه اثربخش با آن نبودند فائق آيند. روشهاي سري هاي زماني مانند ميانگين متحرك، هموارسازي نمايي و الگوريتم باکس-جنکينز و به دنبال آن شبکه هاي عصبي مصنوعي سعي در به دست آوردن توابع غيرخطي چندمتغيره نموده اند که شبکه هاي عصبي مصنوعي نتايج بهتري ارائه کرده اند. در سالهاي اخير ديده مي شود محققان به منظور افزايش کارايي شبکه هاي عصبي مصنوعي آنها را با الگوريتم هايي مانند الگوريتم ژنتيک در قسمت آموزش وزنها ترکيب مي کنند. از آنجا که الگوريتم يادگيري پيش انتشار خطا کارايي خيلي مناسبي در شرايط آشوب و غير خطي از خود نشان نمي دهد الگوريتمهاي بهينه سازي تکاملي اخيرا در يادگيري شبکه هاي عصبي به کار گرفته شده اند. الگوريتم بت (خفاش)، الگوريتمي بهينه ساز است که بر اساس اين حقيقت که خفاش با ارسال امواجي با فرکانس مشخص و تخمين فواصل با تحليل موج بازگشتي مسير خود را مشخص مي نمايد طراحي شده است. اين الگوريتم در برخي کاربردها به کار گرفته شده و اعتبار آن صحه گذاري گرديده است و نشان داده که در سيستمهاي توام با آشوب و رفتارهاي غيرخطي از قدرت قابل قبولي برخوردار مي باشد. کارايي الگوريتم مذکور به کمک معيار خطا MAPE محاسبه گرديده و در قياس با سه الگوريتم ديگر مطابق REF _Ref421027026 \h \* MERGEFORMAT جدول شماره ‏21 بوده است. جدول شماره STYLEREF 1 \s ‏2 SEQ جدول_شماره_ \* ARABIC \s 1 1: مقایسه نتایج پیش بینی مدل بت-عصبی با سه مدل دیگر مدلسهام مخابرات ايرانسهام بيمه آسياشبکه عصبي با 4 نورون7341/16799/2شبکه عصبي با 6 نورون7533/17104/2شبکه عصبي رگرسيون تعميم يافته6938/18885/2مدل بت-عصبي6037/12026/2 همانطور که مشاهده مي گردد کمينه شاخص کارايي در هر دو سهم بر اساس الگوريتم ترکيبي بت-عصبي به دست آمده است. گونه اي ديگر از الگوريتمهاي به کار گرفته شده در پيشگويي قيمت سهم در بازارهاي پول و سرمايه الگوريتمهاي چندعامله هستند. محققان ديگري CITATION MHF12 \l 1065 [7] سيستمي چندعامله براي پيش گويي قيمت سهم در روز بعد با هدف افزايش ( FMAS ) چندعامله فازي چهار لايه قطعيت پيشگويي ارائه نمودند. ايشان بازار سهام را سيستمي پيچيده توضيح داده و اظهار نموده اند براي تصميم گيري هاي سرمايه گذاري در آن نياز به مدلي استوار مي باشد. رويکردهاي چندعامله پيچيدگي سيستم را کاهش مي دهند چرا که سيستم را به اجزاي مستقل کوچکتري تقسيم نموده که هر يک از آنها را با بهترين روش خاص آن حل خواهند نمود و در نهايت حل مساله سيستم پيچيده را به دست مي آورند. معماري سيستم چندعامله ارائه شده در تحقيق مذکور شامل لايه هاي زير مي باشد: لايه 1: لايه ايجاد متاداده مي باشد که در آن داده هاي سهام از منابع داده بيروني به دست آمده و توسط متخصصان علم داده متاداده آن ايجاد مي گردد. لايه 2: در اين لايه پيش پردازش داده ها صورت مي گيرد. انتخاب ويژگي ها به کمک تحليل رگرسيون مرحله اي و نيز مدولار نمودن مساله پيش گويي به کمک خوشه بندي با شبکه عصبي مصنوعي SOM در اين لايه صورت مي پذيرد. لايه 3: اين لايه مسئوليت مدلسازي و ارزيابي آن براي هر يک از خوشه ها به کمک سيستمهاي فازي ژنتيک را به عهده دارد. لايه 4: در اين لايه تحليل مدل و نمايش دانش انجام مي شود. تحليل حساسيت مدل، دقت پيش گويي و ارائه بهنگام سناريوهاي جايگزين تصميم گيري در فرايندهاي شبيه سازي چه-اگر در اين لايه انجام مي شود. خروجي هر يک از لايه ها به کمک پروتکل هاي طراحي شده به لايه ديگر منتقل مي شوند. مدل ارائه شده روي داده هاي سهام چهار شرکت کار گرفته شد و کارايي آن با پنج مدل ديگر که قبلا براي پيشگويي قيمت سهام به کار گرفته شده بودند با شاخص خطا MAPE مقايسه گرديد. نتايج مقايسه به شرح REF _Ref421027141 \h \* MERGEFORMAT جدول شماره ‏22 بوده است. جدول شماره STYLEREF 1 \s ‏2 SEQ جدول_شماره_ \* ARABIC \s 1 2: مقايسه نتايج پيش گويي مدل ارائه شده با مدلهای ديگر مدلIBMBritish AirwaysRyanairDellHMM219/1629/2928/1012/1GA و ANN ، هيبريد HMM849/0646/1377/1669/0HMM هيبريد و منطق فازي779/0529/1356/1405/0ARIMA972/0573/1504/1660/0ANN972/0283/2504/1660/1مدل ارائه شده FMAS630/0440/1240/1420/0 نتايج نشان دهنده آن است که الگوريتم ترکيبي FMAS نتايج مطلوبتري نسبت به پنج الگوريتم رقيب ارائه مي نمايد. تحقيقات صورت گرفته در پيش گويي قيمت سهام در بازارهاي پول و سرمايه نشان دهنده ميزان علاقه مندي محققان به حل مساله پيش گويي در بازارهاي پول و سرمايه نه تنها به دليل تقاضاي بالاي تحليل گران و سرمايه گذاران آن بازار بلکه به دليل پيچيدگي رفتار آن بازار مي باشد. تحقيقات بسيار گسترده اي در اين زمينه صورت گرفته و نتايج متفاوتي به دست آمده است لکن تاکنون هيچ مدل و يا الگوريتمي که قابليت تعميم پذيري آن به اثبات رسيده باشد اعلام نگرديده است. تصوير کلي به تحقيقات پيشين چنين مي نمايد که تحقيقات نسل ابتدايي با الگوريتمهاي شبيه سازي CITATION Dyc84 \l 1065 [8] و CITATION Mal72 \l 1065 [9] آغاز گرديد و به دليل حجم محاسبات در زمان تحقيقات و نتايج با عدم قطعيت زياد اينگونه روشها توسعه نيافتند. نسل دوم تمرکز بر روشهاي سري هاي زماني داشتند. به مرور زمان عدم کارايي اين الگوريتمها به دليل رفتارهاي غير خطي بسيار زياد بازارهاي سهام آشکار گرديد. الگوريتمهاي مذکور به نحو مطلوبي قادر به در نظر گرفتن رفتارهاي پيچيده سهام نبوده اند و در شرايط آشوب عموما فاقد قطعيت مورد نياز در پيش گويي بودند. به مرور زمان نسل سوم تحقيقات، الگوريتمهاي هوش مصنوعي و به ويژه ترکيب الگوريتمهاي هوش مصنوعي با روشهاي سري زماني (مانند CITATION Kaa96 \l 1065 [10]) را به منظور حل مساله پيش گويي قيمت سهام به کار گرفتند. اين الگوريتمها توانايي مناسبي در پيشگويي قيمت يا روند سهم نسبت به الگوريتمهاي قبلي داشتند. اگر چه اين الگوريتمها توانايي بهتري در مواجه با شرايط آشوب و غيرخطي نسبت به مدلهاي قبلي داشتند لکن کماکان سطح قابل اطميناني در مواجهه با شرايط آشوب ارائه نمي نمودند. الگوريتمهاي ترکيبي هوش مصنوعي و بهينه سازي تکاملي در نسل چهارم نشان داده اند که به نحو مناسبتري مي توانند رفتارهاي غيرخطي را در نظر بگيرند. خلاصه يافته هاي اين تحقيق با مرور تحقيقات پيشين به شرح REF _Ref421027228 \h \* MERGEFORMAT جدول شماره ‏23 مي باشد. جدول شماره STYLEREF 1 \s ‏2 SEQ جدول_شماره_ \* ARABIC \s 1 3: نسل بندي روشهاي تحقيق در پيش بيني قيمت سهم نسل اولنسل دومنسل سومنسل چهارمروشهاي شبيه سازيروشهاي سري هاي زمانيروشهاي هوش مصنوعي و ترکيبي با سري هاي زمانيروشهاي هوش مصنوعي و ترکيبي با الگوريتمهاي تکاملي و سري هاي زماني مرور تحقيقات نسل چهارم مشخص مي نمايد که تمرکز بر الگوريتمهاي ژنتيک، بهينه سازي ازدحام ذرات بيش از سايرين مي باشد. تعداد بسياري از تحقيقات سال هاي اخير نشان مي دهند که الگوريتم هاي مذکور در بسياري موارد در پيش بيني هاي مختلف در حوزه بازارهاي پول و سرمايه به کار گرفته شده اند. الگوريتم رقابت استعماري در سال 2007 ارائه گرديد و در مواردي مورد وثوق محققان قرار گرفته است. سابقه تحقيقات زيادي در به کارگيري اين الگوريتم نسبتا جديد در پيش بيني بازارهاي پولي و سرمايه يافت نشد لکن اخيرا در تحقيقاتي مانند CITATION Rez13 \l 1065 [11]، کارا بودن اين الگوريتم در پيش بيني قيمت سهم مورد بررسي قرار گرفته اند. 2-2 انتخاب/ استخراج ويژگي در قيمت سهم در تحقيقات پيشين با توجه به حجم زياد داده هاي مالي که در تحليل و پيش بيني هاي قيمت سهام شرکتها در بورس اوراق بهادار به کار گرفته مي شود کاهش داده ها از ارزش ويژه اي برخوردار است. تحقيقات بسياري در حوزه کاهش داده ها با روشهاي گوناگون صورت گرفته است و نتايج آنها مورد استفاده هاي کاربردي قرار گرفته اند. در تحقيقي CITATION محم84 \l 1065 [12] محققان با به کارگيري رگرسيون خطي کلاسيک و خود رگرسيون ناهمسان واريانس شرطي دريافته اند که روز شنبه بازدهي مثبت و معني دار داشته و در کنار آن روز يکشنبه بازدهي منفي و معني داري دارد. تحقيقي ديگر CITATION رضا87 \l 1065 [13] بي قاعدگي هاي غير تقويمي و بي قاعدگي هاي تقويمي را طبقه بندي نموده است. بي قاعدگي هاي غير تقويمي شامل اثر تجزيه سهم، اثر بازده سود سهام، اثر سود نقدي سهم، اثر سهام با قيمت پايين، اثر معامله محرمانه، اثر انتشار اطلاعات، اثر بيش واکنشي بازار، اثر کم واکنشي بازار، اثر خاص کشور، اثر عرضه اوليه سهم، اثر شاخص، اثر تاخير در ارائه گزارش سودآوري، اثر سودهاي شگفت آور، اثر شرکت از قلم افتاده، اثر قيمت پيش از انتشار اعلاميه سود، اثر بازگشت به ميانگين طي دوره بلند مدت بر شمرده شده و اثر چرخش سياسي، اثر تابستان، اثر روزهاي تعطيل يا اثر روزهاي قبل از روزهاي تعطيل، اثر روزهاي آخر هفته، اثر چرخش ماه (نيمه اول ماه)، اثر ماه هاي خاص سال و اثر پايان سال به عنوان بي قاعدگي هاي تقويمي ثبت شده اند. در آن تحقيق با به کارگيري رگرسيون با متغيرهاي مستقل مجازي اثر معني دار بر بازدهي در روزهاي ماه هاي محرم، رمضان و صفر به اثبات رسيده اند. جداسازي فرصتهاي معاملاتي سودآوري که براي دوره اي ماندگار است به کمک روش بازنمونه گيري بوت استرپ ناپارامتريک براي بررسي و پيش بيني الگوي دوره اي در بازدهي ماهانه سهام در تحقيق ديگيري CITATION محس90 \l 1065 [14] بررسي گرديده است. محققان ديگري CITATION فاط91 \l 1065 [15] در بورس اوراق بهادار تهران به کمک رگرسيون فازي با توابع عضويت مثلثي اقدام به فازي سازي متغيرهاي مجازي نموده و بدين ترتيب اثر ابهامات و رفتارهاي غيرخطي انساني را در نظر گرفتند. خروجي اين تحقيق بازده مثبت معني دار روزهاي يکشنبه و بازده منفي معني دار روزهاي سه شنبه را نشان مي دهد. روش فيلترهاي وفقي با روش جستجوي الگوريتم حداقل ميانگين مربعات (LSM) جهت تغييرات ضرايب فيلتر در مدل رگرسيون و مقايسه با نتايج مدل هاي گارچ توسط محققان ديگري CITATION شمس92 \l 1065 [16] مورد استفاده قرار گرفت. نتيجه شفاف شدن بازدهي مثبت معني دار در روزهاي يکشنبه بوده است. : مبانی نظری تحقیق 3-1 بازار بورس اوراق بهادار بازار بورس اوراق بهادار بازاري است که در آن قيمت سهام شرکتهاي سرمايه پذير و ساير اوراق بهادار قابل معامله با رقابت عرضه و تقاضا بين خريداران و فروشندگان تعيين مي گردد. هر شخصيت حقوقي و يا حقيقي مي تواند با دريافت کد معامله با هر ميزان سرمايه در اين بازار اقدام به معامله خريد و يا فروش نمايد. هر فعال اين بازار بر اساس نتايج تحقيقات و بررسي هاي خود تصميم به خريد و يا فروش سهام شرکتي مي نمايد و بدين ترتيب سود و يا زيان خود را رقم مي زند. اندازه اين بازار بيش از 342 هزار ميليارد تومان در نيمه اول سال 1393 بوده و سهام بيش از چهارصد و پنجاه شرکت سرمايه پذير در 35 صنعت و کسب و کار در اين بازار ارائه گرديده اند. هر معامله گر با بررسي وضعيت عملکرد مالي ، پروژه ها و توانمنديهايي رقابتي و توسعه اي و نيز وضعيت کسب و کار شرکت مورد علاقه خود در مقايسه با ساير کسب و کارها و شرکتها تصميم به خريد و يا فروش سهم آن شرکت مي گيرد. سايتهاي رسمي زير که تحت نظر سازمان بورس اوراق بهادار مي باشند انواع اطلاعات معاملات و برخي شاخصهاي مالي مورد نياز جهت تحليل هاي تصميم گيري را در اختيار فعالان قرار مي دهند: www.tse.ir www.tsetmc.com www.irbourse.com www.seo.ir 3-2 تکنيکهاي رايج تحليل و پيش بيني قيمت سهام معامله گران بورس عموما از يکي و يا ترکيب دو رويکرد تکنيکال و بنيادين در تحليل معاملات استفاده مي کنند. در رويکرد تکنيکال فرض اساسي آن است که اثر هرگونه عامل اثرگذار در قيمت سهم در دل پيشينه روندها و رفتار قيمت سهم وجود دارد. بر اين اساس تحليل گران اين مکتب تمرکز خود را بر بررسي رفتار قيمت سهم در گذشته قرار داده و سعي مي کنند با کشف الگوهاي مشخصي، رفتار قيمت سهم در آينده را پيش بيني کنند. براي بهبود تحليلهاي اين گروه، برخي شاخصهاي ترکيبي نيز مانند MACD، RSI، STO، ADX توسط نرم افزارهاي طراحي شده جهت تحليل هاي تکنيکيال در اختيار ايشان قرار مي گيرد. REF _Ref421017548 \h شکل شماره ‏31 نمونه اي از نمودارهاي مورد استفاده در رويکرد تکنيکال است. شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 1 : نمونه اي تحليل قيمت سهم با ابزارهاي رويکرد تحليل تکنيکال در تحليل بنيادين، تحليل گران با بررسي صورتهاي مالي و گزارش عملکرد و برنامه و بودجه شرکت اقدام به بررسي توان سودآوري شرکت مي نمايند و بر آن اساس تصميم به خريد و يا فروش سهم آن شرکت مي گيرند. پايداري سودآوري، نسبت مطالبات به بدهي ها، رفتار و مديريت هزينه ها، آناليز اجزاي بهاي تمام شده، ترکيب سهام داران شرکت، وضعيت گردش وجوه نقد، پروژه هاي توسعه اي و سرمايه گذاري ها و نيز بازار محصولات و خدمات شرکت از جمله عواملي هستند که توسط اين گروه تحليل گران مد نظر قرار مي گيرند. به صورت خلاصه مي توان عنوان نمود عموما تحليل تکنيکال اغلب با هدف تجارت (معامله) در کوتاه مدت به کمک چارتها و نمودارهاي قيمت و حجم معامله صورت مي گيرد در حالي که تحليل بنيادين به منظور سرمايه گذاري بلند مدت بوده و به کمک کليه فاکتورهاي کمي و کيفي و صورتهاي مالي صورت مي پذيرد. 3-3 تکنيکهاي نوين تحليل داده ها تکنيکهاي تحليل تکنيکال و بنيادين هر دو بسيار به تجربه و صلاحيتهاي فردي تحليل گر وابسته هستند. انتخاب فاکتورهاي مختلف، تعيين وزن نسبي هر يک و چگونگي قرار دادن آنها در کنار هم به منظور ايجاد يک تصميم قابل اعتماد تنها از عهده يک تحليل گر چيره دست بر مي آيد. آيا تکنيکهاي روز تحليل داده ها مي تواند چنين نقشي را ايفا نمايند؟ بدون شک در سالهاي اخير شاهد پيشرفت علوم داده پردازي بوده ايم. دانش جديد داده کاوي به عنوان بستر اصلي الگوريتمها و روشهاي پردازش و تحليل داده ها جايگاه خود را در ميان تحليل گران باز نموده و کمک هاي اثربخشي را ارائه مي نمايد. 3-3-1 داده کاوي سير تحول داده به اطلاعات، اطلاعات به دانش و دانش به خرد را هر علاقه مند حوزه اطلاعات مي شناسد. علاقه مندي انسان به تحليل، سناريوپردازي و پيش گويي رويدادها اين سير تحول را ترسيم نموده است. نياز به بقاء در انسان بدوي او را ملزم به کنترل داده وجود ذخيره غذايي مي کرد. وي با دريافت آن داده اقدام به شکار و يا استراحت مي نمود. آسيبهاي محيطي بسيار مانند بارندگي نياز به پيش بيني تحليلي را در انسان پديد آورد. انسان با کنار هم قرار دادن داده دماي هوا، وجود ابرهاي سياه در آسمان، سرعت حسي باد و تجربيات شرايط بارندگي هاي گذشته، سعي در اطلاعات سازي و آماده شدن براي شرايط بارندگي نمود. پديده هاي پيچيده و پيچيده تري پيش روي انسان قرار گرفتند. هيجان پيش بيني بروز هر پديده در انسان سبب پيدايش علوم گوناگوني گرديد. محققان و انديشمندان علوم گوناگون مدلهاي بي شماري را براي دستيابي به هدف تحليل و پيش بيني ارائه نمودند. انواع فرمولهاي فيزيک و شيمي، فرمولهاي مقاومت مصالح، روشهاي رياضي بهينه سازي، مدلهاي تصميم گيري چند معياره و بسياري مدل ديگر در اين سير تحول به وجود آمدند. در اين بين، حل بسياري از مسائل پيچيده تر نياز به داده هاي متنوع و بيشتر و بيشتر را مي طلبيد. کسري داده هاي مورد نياز هم در متغيرها و هم در حجم داده و نيز عدم وجود زيرساخت محاسباتي کارا جهت محاسبات و تحليل داده هاي بزرگ مبناي ايجاد روشهاي بر مبناي نمونه گيري گرديد. علم آمار در اين افق زماني خدمات بسياري در تحليلها ارائه نمود. با به کار گيري مدلها و روشهاي مبتني بر نمونه گيري هاي آماري خدمات و پيشرفتهاي شگرفي در علوم مختلف به دست آمد لکن نرخ اين پيشرفتها به مرور زمان کند گرديد. علت اين کاهش، پيچيده تر شدن مسائل دنياي واقعي و عدم کفايت تحليلهاي نمونه اي در حل آنها بود. گويا نقش به ناچارِ علمِ آمارِ نمونه اي در حال از بين رفتن بوده و حل مسائل پيچيده دنياي واقعي امروز، روشهايي را طلب مي کنند که بتوانند حجم کل داده ها را فراهم و تحليل کنند. يکي از مشکلات محاسبات داده ها، قدرت پردازشگرها بود. طبق قانون مور، قدرت محاسبات پردازشگرها هر هجده ماه دو برابر مي شد و اين نويدبخش تامين زيرساخت مواجهه با مشکل محاسبات داده هاي بزرگ بود. امروزه بسياري از منابع داده اي، به شکل استاندارد شده قابل دستيابي و به کارگيري بوده و پردازشگرهاي نوين با سرعت بسيار زياد، مناسب براي محاسبات داده هاي بزرگ ايجاد شده و در حال بهبود و ترقي مي باشند. با رفع مشکلات زيرساختي داده پردازي در کنار نياز انسان به حل مسائل پيچيده دنياي واقعي، علوم جديدي مانند دانش داده کاوي ظهور نمود. ماموريت دانش نوين داده کاوي کشف دانش پنهان در داده هاي بزرگ مي باشد. پاسخ سئوالاتي مانند "اگر مشتري، کالاي الف و ب را خريد کند حتما کالاي ج را نيز خريد خواهد کرد؟" ، "آيا سهام شرکت الف جز گروه سهام هاي سريع نقد شونده خواهد بود؟"، "قيمت دلار در سه روز آينده چند خواهد بود؟"، "شکل و جهت رشد سلولهاي سرطاني در ريه بيمار در هفته آينده چطور خواهد بود؟" را داده کاوي خواهد داد. مراحل انجام اين تحقيق مطابق فرايند CRISP داده کاوي CITATION جما92 \l 1065 [17] صورت خواهد گرفت. اين فرايند به صورت گسترده اي از طرف کاربران صنعتي داده کاوي مورد استفاده قرار گرفته است. اين مدل از شش مرحله که به صورت يک فرايند حلقه اي است و در REF _Ref412629561 \h \* MERGEFORMAT شکل شماره ‏32 نشان داده شده است تشکيل مي گردد. شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 2 : فرايند CRISP مراحل اين فرايند به صورت زير است: مرحله تعريف مساله شامل تعريف هدف، ارزيابي شرايط فعلي، تعريف اهداف داده کاوي و ايجاد برنامه زمانبندي پروژه است. وقتي که هدف مساله مشخص شد و برنامه ريزي پروژه انجام گرفت مرحله تحليل داده ها نيازمندي هاي داده اي را مورد مطالعه قرار مي دهد. اين مرحله شامل تهيه مجموعه داده هاي اوليه، توصيف داده ها، کنکاش داده ها و ارزيابي کيفيت داده ها مي باشد. کنکاش داده ها شامل مشاهده پارامترهاي آماري، مي تواند در پايان اين مرحله نيز اتفاق بيافتد. مدلهايي مثل خوشه بندي مي تواند در طول اين گام به منظور شناسايي الگوها در داده ها انجام گيرد. زماني که منابع در دسترس مشخص شدند، بايد داده ها از آنها انتخاب شوند، پاک شوند و در قالب مورد نظر ريخته شوند. همچنين کنکاش عميق تر داده ها نيز در طول اين مرحله که مرحله آماده سازي داده ها مي باشد مي تواند انجام گيرد. به علاوه ممکن است مدل هاي ديگري نيز به کار روند تا بتوان الگوها را بر اساس تعريف مساله استخراج نمود. ابزارهاي نرم افزاري داده کاوي همچون تصويرسازي و تحليل خوشه بندي براي تحليل هاي اوليه مفيد هستند. ابزارهايي مانند شناسايي قوانين عمومي مي تواند قوانيني همبستگي اوليه را استخراج کند. وقتي که فهم بيشتري از داده ها به وسيله شناسايي الگو که با توجه به خروجي هاي مدلهاي اوليه حاصل مي شود افزايش مي يابد مدلهاي تخصصي تر بر حسب نوع داده مي تواند مورد استفاده قرار بگيرد. اين فعاليت در مرحله مدلسازي صورت مي گيرد. نتايج مدلهاي استفاده شده در مراحل قبلي بايد در بستر مساله تعريف شده و اهداف تعريف شده در مراحل بعد مورد ارزيابي قرار بگيرد. اين کار منجر به شناسايي نيازمندي هاي بعدي خواهد شد. اين نيازها اغلب شامل بازگشت به مراحل قبلي در فرايند CRISP است. تعريف مساله در داده کاوي، فرايند تکراري با بازگشت به عقب است که در آن نتايج اقدامات مدلسازي مختلف و تکرار آنها روابط جديد بين داده ها را به کاربر نشان مي دهد که باعث درک عميق تر از مساله براي کاربر خواهد شد. داده کاوي هم مي تواند براي بررسي صحت فرضيه هايي که قبلا وجود داشته مورد استفاده قرار مي گيرد و هم براي کشف دانش: يعني شناسايي روابط غير منتظره و مفيد. به کمک دانش کشف شده در مراحل قبلي فرايند CRISP مدلهاي درست و منطقي حاصل مي شوند که مي توان آنها را در تجارت و کسب و کار براي اهداف مختلف به کار برد. اين اهداف مي توانند شامل پيش بيني يا شناسايي شرايط حساس و کليدي باشند. مدلهاي به دست آمده بايد در حين استفاده مورد پايش قرار گيرند چرا که چيزي که امروز درست است ممکن است يک سال ديگر درست نباشد، بنابراين اگر تغييرات اساسي در طول استفاده از مدلها به وجود بيايد مدلها بايد مجددا ايجاد شوند. از طرفي نتايج حاصل از پروژه هاي داده کاوي بايد ثبت شوند چنانکه اسناد تهيه شده در مطالعات آتي مورد استفاده قرار گيرند. اين فرايند شش مرحله اي به هيچ وجه غير منعطف نيست. يعني بسته به شرايط مساله، برخي از مراحل ممکن است حذف شوند يا مورد تاکيد بيشتري قرار گيرند. داده کاوي به منظور کشف دانش پنهان در داده بزرگ از روشها و تکنيکهاي زير استفاده مي نمايد: قواعد انجمني :الگوهايي که بر اساس آن يک رويداد به ديگري مربوط مي‌شود مثلاً خريد قلم به خريد کاغذ ترتيب: الگويي که به تجزيه و تحليل توالي رويدادها پرداخته و مشخص مي‌کند کدام رويداد، رويدادهاي ديگري را در پي دارد مثلاً تولد يک نوزاد و خريد پوشک پيش بيني: در پيش بيني، هدف پيش بيني يک متغير پيوسته مي باشد. مانند پيش بيني نرخ ارز يا هزينه هاي درماني دسته بندي: فرآيندي براي پيدا کردن مدلي است که رده هاي موجود در داده‌ها را تعريف مي نمايد و متمايز مي کند، با اين هدف که بتوان از اين مدل براي پيش بيني رده رکوردهايي که برچسب رده آنها(متغير هدف) ناشناخته مي باشد، استفاده نمود. در حقيقت در رده بندي بر خلاف پيش بيني، هدف، پيش بيني مقدار يک متغير گسسته است. روش هاي مورد استفاده در پيش بيني و دسته بندي عموما يکسان هستند. خوشه بندي: گروه بندي مجموعه اي از اعضاء، رکوردها يا اشياء به نحوي که اعضاي موجود در يک خوشه بيشترين شباهت را به يکديگر و کمترين شباهت را به اعضاي خوشه هاي ديگر داشته باشند. بصري سازي: مصورسازي داده ها يکي از قدرتمندترين و جذابترين روش هاي اکتشاف در داده ها مي باشد. داده کاوي در هر يک از تکنيکهاي اشاره شده در بالا از انواع متدها و الگوريتم هايي مانند رگرسيون، آمار توصيفي، آناليز واريانس، شبکه عصبي مصنوعي، ماشينهاي بردار پشتيبان و غيره به فراخور استفاده مي نمايد. 3-3-2 شبکه عصبي مصنوعي بشر از ديرباز علاقه مند به پياده سازي ساختار پردازش مغز انسان در يک سيستم مصنوعي بوده است. مغز انسان به عنوان برترين سيستم پردازش شناخته شده، با دريافت انواع ورودي هاي اطلاعاتي خروجي هاي مورد انتظار را در سريعترين زمان ممکن و با بهترين دقت مي تواند ارائه نمايد. دانشمندان و محققان علوم مختلف همواره کوشيده اند تا از اين قابليت متمايز در پردازش اطلاعات و پاسخ به سئوالات رشته علمي خود بهره مند شوند. نورون کوچکترين واحد پردازش اطلاعات تاکنون شناخته شده سيستم پردازش مغز انسان است که تاکنون شناخته شده است. REF _Ref412629582 \h \* MERGEFORMAT شکل شماره ‏33 نمايشي از يک نورون مي باشد. شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 3 : ساختار يک نورون هر نورون از سه بخش اصلي تشکيل شده است: هسته، دندريت، اکسون. دندريتها سيگنالهاي الکتريکي را از اکسونهاي نورونهاي ديگر دريافت نموده و آن را به هسته نورون تحويل مي دهند. هسته نورون پس از پردازش ورودي ها، سيگنال الکتروشيميايي به عنوان خروجي تحويل اکسون داده و اکسون آن را تحويل دندريت نورون هاي ديگر مي دهد. محل تلاقي اکسون و دندريت را سيناپس و اتصال آن دو را اتصال سيناپسي که نوعي خاص از اتصال بيولوژيک مي باشد مي نامند. شبکه عصبي مصنوعي CITATION Hag96 \l 1065 [18] مدلي محاسباتي الهام گرفته از شبکه عصبي مغز مي باشد که با دريافت داده هاي ورودي، تخمين و يا تابع تقريب را شکل داده و خروجي مورد انتظار را ارائه مي نمايد. شبکه عصبي مصنوعي در طراحي تابع تقريب به عنوان مثال در پيش بيني سري هاي زماني، دسته بندي و شناسايي الگو، پردازش داده ها مثلا در خوشه بندي و فيلترسازي داده ها کاربرد دارند. تشخيص صدا، تشخيص متن، هدايت مسير ربات نمونه هاي ديگري از کاربردهاي شبکه عصبي مصنوعي هستند. شبکه عصبي مصنوعي سرعت محاسباتي قابل قبولي داشته، در شرايط جديد مي تواند پاسخ يکتا ارائه نمايد و ضمنا از تجربيات گذشته مي آموزد لکن از آنجا که منطق و قاعده کار آن به خوبي قابل تفسير نيست، به منظور تست و روايي آن نياز به حجم زيادي داده است. ساختار شبکه عصبي مصنوعي شامل چندين نورون در لايه بندي مشخص مي باشد که با دريافت ورودي ها، خروجي ايجاد مي نمايد. REF _Ref412629599 \h \* MERGEFORMAT شکل شماره ‏34 نمونه اي از يک شبکه عصبي مصنوعي را نشان مي دهد. شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 4 : نمونه اي از يک شبکه عصبي مصنوعي با يک لايه پنهان انواع مختلفي از شبکه عصبي مصنوعي تاکنون ارائه گرديده است که از آن جمله مي توان به موارد زير اشاره نمود: شبکه عصبي پيش رو، شبکه عصبي RBF، شبکه عصبي نگاشت خود سازمانده، شبکه عصبي LVQ، شبکه عصبي برگشتي، شبکه عصبي مدولار. در شبکه هاي عصبي پيش رو، يک نورون را به صورت REF _Ref412629619 \h \* MERGEFORMAT شکل شماره ‏35 در نظر بگيريد: شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 5 : نمونه نورون در شبکه عصبي مصنوعي پيشرو خروجي هر نورون به صورت معادله (1) محاسبه مي شود: معادله (1)Oj=f(i=1nwiXi+bj) که در آن Oj خروجي نورون j ام، Xi ورودي i ام، wi وزن اثر ورودي i ام و bj باياس نورون j ام مي باشد. همچنين f تابع انتقال (فعال سازي) بوده که تعداد متعددي تابع براي آن پيشنهاد گرديده است. به عنوان مثال مي توان به تابع سيگموئيد و تابع تانژانت هايپربوليک اشاره نمود. ورودي ها، تابع فعالسازي و فرمول محاسبه خروجي مشخص مي باشند و تنها متغير مجهول باقيمانده براي محاسبه خروجي وزن اثر هر يک از ورودي ها مي باشند. به فرايند تعيين وزن اثر هر يک از ورودي ها در شبکه عصبي مصنوعي، فرايند آموزش و يا يادگيري گفته مي شود. به طور کلي، تعيين وزن متغيرها با به کارگيري الگوريتمهاي مرحله اي صورت مي گيرد. رمز موفقيت شبکه عصبي مصنوعي در تعيين هر چه اثربخش تر وزنهاي ورودي ها و يا به عبارتي آموزش مطلوبتر شبکه مي باشد. يکي از روشهاي عمومي تعيين وزن ورودي ها به کارگيري الگوريتم پيش انتشار خطا مي باشد. در اين روش، با مقايسه خروجي هر مرحله با خروجي مورد انتظار، خطاي محاسبه تعيين گرديده و با محاسبه گراديان خطا و بازتخصيص وزن ها به هر نورون در هر اجرا اقدام به بهينه سازي وزن ها و آموزش شبکه عصبي مصنوعي مي شود. REF _Ref421017674 \h \* MERGEFORMAT جدول شماره ‏31 CITATION Pau94 \l 1033 [19] شبه کد الگوريتم پيش انتشار خطا را نمايش مي دهد. جدول شماره STYLEREF 1 \s ‏3 SEQ جدول_شماره_ \* ARABIC \s 1 1: شبه کد الگوريتم پيش انتشار خطا initialize network weights (often small random values) do forEach training example ex prediction = neural-net-output(network, ex) // forward pass actual = teacher-output(ex) compute error (prediction - actual) at the output units compute for all weights from hidden layer to output layer // backward pass compute for all weights from input layer to hidden layer // backward pass continued update network weights // input layer not modified by error estimate until all examples classified correctly or another stopping criterion satisfied return the network براي آموزش شبکه عصبي مصنوعي الگوريتم هاي ديگري توسط محققان پيشنهاد گرديده است. الگوريتمهاي بهينه سازي کلاسيک مورد اشاره در روشهاي تحقيق در عمليات، روشهاي ابتکاري و فراابتکاري بهينه سازي و نيز الگوريتم هاي بهينه سازي تکاملي مانند الگوريتم ژنتيک و الگوريتم بهينه سازي ازدحام ذرات از ان جمله اند. به منظور طراحي و معماري شبکه عصبي مصنوعي مي بايد تعداد لايه ها و تعداد نورون ها در هر لايه به همراه تابع فعالسازي را مشخص نمود. عموما تعداد لايه پنهان بيش از سه عدد سبب بيش برازش شده و مدل به جاي يادگيري اقدام به حفظ کردن مي نمايد. تعداد نورون هاي در هر لايه نيز با توجه به محدوديتهاي محاسباتي و اثرگذاري بر قطعيت خروجي شبکه عصبي مصنوعي تعيين مي گردد. عموما در شبکه عصبي مصنوعي با يک لايه پنهان، تعداد نورون ها در لايه پنهان از جذر ضرب تعداد نورون هاي ورودي در تعداد نورون هاي خروجي تخمين زده مي شود. تابع فعالسازي نيز حسب ماهيت رفتار داده مورد بررسي از بين توابع اشاره شده انتخاب مي گردد. براي محاسبه دقت و يا خطاي شبکه عصبي مصنوعي از شاخصهاي متنوعي استفاده مي گردد که پرکاربردترين آنها ميانگين مربع خطا (mse) و جذر ميانگين مربع خطا (rmse) مي باشند. 3-3-3 الگوريتمهاي تکاملي الگوريتم هاي متعددي با عنوان الگوريتمهاي تکاملي توسط محققان ارائه شده اند. ايده کلي در کليه اينگونه الگوريتمها مشابه يکديگر مي باشد: بر روي يک جمعيت از اعضاء به علت طبيعي اي انتخاب صورت مي گيرد (بقاي منطبق) و اين سبب افزايش ميزان تطبيق جمعيت مي شود. با در نظر گرفتن يک تابع هزينه به صورت تصادفي مجموعه راه حلهاي کانديدا انتخاب مي شود. بر اساس اين تطبيق برخي از بهترين کانديداها براي رفتن به نسل بعد با به کارگيري بازترکيب و يا جهش انتخاب مي شوند. بازترکيب عملگري است که روي دو يا بيشتر کانديداي انتخاب شده اعمال شده و يک يا بيشتر کانديداي جديد ايجاد مي نمايد. جهش روي يک کانديدا صورت گرفته و يک کانديداي جديد ايجاد مي نمايد. کانديداهاي خروجي بازترکيب و يا جهش مجموعه جديدي را تشکيل داده و بر سر ميزان تطبيق براي رفتن به نسل بعد با مجموعه کانديداهاي قبلي به رقابت مي پردازند. اين مراحل تا آنجا که يکي از کانديداها سطح کيفيت مورد انتظار را برآورده نمايد و يا حد مورد انتظار از پيش تعيين شده اي ارضاء شود تکرار مي شود. در الگوريتمهاي تکاملي، تکامل به سمت بهينگي است و يا حداقل نزديکي. به صورت کلي، تکامل يک فرايند تطبيق است. به عبارت ديگر، الگوريتم تکاملي جمعيت را با محيط بيشتر و بيشتر تطبيق مي دهد. شکل کلي الگوريتمهاي تکاملي در شبه کد REF _Ref421017757 \h \* MERGEFORMAT جدول شماره ‏32 نمايش داده شده است. جدول شماره STYLEREF 1 \s ‏3 SEQ جدول_شماره_ \* ARABIC \s 1 2: شبه کد عمومي الگوريتم هاي تکاملي BEGININITIALISE population with random candidate solutions;EVALUATE each candidate;REPEAT UNTIL (TEMINATION CONDITION is satisfied) DO1 SELECT parents;2 RECOMBINE pairs of parents;3 MUTATE the resulting offspring;4 EVALUATE new candidates;5 SELECT individuals for the nxt generation;DOEND REF _Ref412629788 \h \* MERGEFORMAT شکل شماره ‏36 در قالب فلوچارت الگوريتمهاي تکاملي را نمايش مي دهد: شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 6 : فلوچارت عمومي الگوريتم هاي تکاملي اجزاي اصلي الگوريتمهاي تکاملي عبارتند از عضو، تابع تکامل (تابع تطبيق)، جمعيت، مکانيزم انتخاب والدين، عملگر بازترکيب و جهش، مکانيزم انتخاب بازماندگان (مکانيزم جايگزيني). از شناخته شده ترين الگورتميهاي تکاملي مي توان به الگوريتمهاي زير اشاره نمود: الگوريتم ژنتيک، الگوريتم توده مورچگان، الگوريتم توده زنبور عسل، الگوريتم استراتژي تکامل، الگوريتم تبريد شبيه سازي شده، الگوريتم بهينه سازي ازدحام ذرات 3-3-3-1 الگوريتم ژنتيک الگوريتم ژنتيک CITATION JSG05 \l 1065 [20] روش يادگيري بر پايه تکامل بيولوژيک است که در سال 1970 توسط John Holland معرفي گرديد. يک الگوريتم ژنتيک براي حل يک مساله مجموعه بسيار بزرگي از راه حل هاي ممکن را توليد مي کند. هر يک از راه حل ها با استفاده از يک تابع تناسب مورد ارزيابي قرار گرفته و تعدادي از بهترين راه حل ها در فرايندي به نام تکامل کانديد توليد راه حل هاي جديد مي شوند. بدين ترتيب فضاي جستجو در جهتي تکامل پيدا مي کند که به راه حل مطلوب برسد. الگوريتم ژنتيک در مسائلي که فضاي جستجوي بزرگي داشته باشند مي تواند به کار گرفته شود. همچنين در مسائلي که با فضاي فرضيه پيچيده که تاثير اجزاي آن در فرضيه کلي ناشناخته باشند مي توان از اين الگوريتم براي جستجو استفاده نمود. بهينه سازي گسسسته از ديگر کاربردهاي اين الگوريتم بوده و مزيت حداقل بودن احتمال به تله افتادن در کمينه محلي در آن نسبت به ساير الگوريتم هاي تکاملي مناسب تر مي باشد. اين الگوريتم از لحاظ محاسباتي پرهزينه بوده و ضمنا تضميني براي رسيدن به جواب بهينه ندارد. روش متداول پياده سازي الگوريتم ژنتيک بدين ترتيب مي باشد که ابتدا مجموعه اي از حل ها (کانديداها) که جمعيت ناميده مي شود توليد و به طور متناوب با حل هاي ديگر جايگزين مي شوند. در هر مرتبه، تمامي حل ها با استفاده از يک تابع تناسب مورد ارزيابي قرار داده مي شوند. آنگاه تعدادي از بهترين حل ها با استفاده از يک تابع احتمال، انتخاب شده و جمعيت جديد را تشکيل مي دهد. تعدادي از فرضيه هاي انتخاب شده به همان صورت مورد استفاده واقع شده و مابقي با استفاده از عملگرهاي ژنتيکي نظير ترکيب و جهش براي توليد فرزندان به کار مي روند. به صورت کلي مي توان اين الگوريتم را به صورت شبه کد REF _Ref421017908 \h \* MERGEFORMAT جدول شماره ‏33 نمايش داد: جدول شماره STYLEREF 1 \s ‏3 SEQ جدول_شماره_ \* ARABIC \s 1 3: شبه کد الگوريتم ژنتيک // Initialise generation 0: k := 0; Pk := a population of n randomly-generated individuals; // Evaluate Pk: Compute fitness(i) for each i ∈ Pk;do { // Create generation k + 1: // 1. Copy: Select (1 − χ) × n members of Pk and insert intoPk+1; // 2. Crossover: Select χ × n members of Pk; pair them up; produce offspring; insert the offspring intoPk+1; // 3. Mutate: Select µ × n members of Pk+1; invert a randomly-selected bit in each; // Evaluate Pk+1: Compute fitness(i) for each i ∈ Pk; // Increment: k := k + 1; } while fitness of fittest individual in Pk is not high enough; return the fittest individual from Pk; عملگر ترکيب با استفاده از دو رشته والد دو رشته فرزند به وجود مي آورد. براي اين کار قسمتي از بيت هاي والدين در بيتهاي فرزندان کپي مي شود. انتخاب بيت هايي که بايد از هر يک از والدين کپي شوند به روشهاي مختلف انجام شده و براي تعيين محل بيت هاي کپي شده از يک رشته به نام ماسک ترکيب استفاده مي شود. در روش رايج تقاطع تک نقطه اي، يک نقطه تصادفي در طول رشته انتخاب شده و والدين در اين نقطه به دو قسمت مي شوند. هر فرزند با انتخاب تکه اول از يکي از والدين و تکه دوم از والد ديگر به وجود مي آيد. REF _Ref412629837 \h \* MERGEFORMAT شکل شماره ‏37 شيوه انجام ترکيب تک نقطه اي را نمايش مي دهد. شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 7 : نمايش ترکيب تک نقطه اي عملگر جهش براي به وجود آوردن فرزند فقط از يک والد استفاده مي کند. اين کار با انجام تغييرات کوچکي در رشته اوليه به وقوع مي پيوندد. با استفاده از يک توزيع يکنواخت يک بيت به صورت تصادفي انتخاب و مقدار آن تغيير پيدا مي کند. معمولا جهش بعد از ترکيب اعمال مي شود. ترکيب خاصيت جستجوگرانه داشته و مي تواند با انجام پرش هاي بزرگ به محل هايي در بين والدين رفته و نواحي جديدي را کشف کند و جهش با خاصيت گسترشي مي تواند با انجام تغييرات کوچک تصادفي به نواحي کشف شده وسعت ببخشد. 3-3-3-2 الگوريتم بهينه سازي ازدحام ذرات الگوريتم بهينه سازي ازدحام ذرات الگوريتمي مبتني بر جمعيت است. اين الگوريتم با الهام گرفتن از حرکت دسته جمعي جمعيتهاي طبيعي مانند پرندگان و ماهي ها که به صورت فردي رفتار هوشمندانه اي ندارند ولي رفتار گروهي آنها هوشمندانه است ارائه گرديده است. منظور از ذره در اين الگوريتم همان موقعيت کانديداي جواب مساله است. مسير جستجوي ذره براي رسيدن به پاسخ، مسيري خطي با ضرايب کاملا تصادفي از حرکت به سمت بهترين نقطه محلي و حرکت به سمت بهترين نقطه جهاني مي باشد. حرکت به سمت بهترين نقطه محلي به عبارتي حرکت مبتني بر دانش خود ذره يا حرکت خودخواهانه ناشي از ادراک ذره بوده و حرکت به سمت بهترين نقطه جهاني، حرکت مبتني بر رفتار جمعي و يا به عبارتي حرکت صرفا ناشي از رفتار اجتماعي ذره مي باشد. در REF _Ref412629852 \h \* MERGEFORMAT شکل شماره ‏38 فرض کنيد xi- موقعيت فعلي ذره بوده و xi+ موقعيت مرحله بعدي ذره را مشخص مي نمايد. شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 8 : نمايش حرکت ذره در PSO موقعيت مرحله بعدي ذره در هر مرحله به کمک معادله(2) تعيين مي شود. معادله (2)xi+=xi-+vi+ که در آن vi+ ميزان انتقال ذره تا مرحله بعدي را نشان داده و به صورت معادله (3) محاسبه مي شود: معادله (3)vi+=c1r1xlb--xi-+c2r2xgb-xi-+wv- که در آن wv- نشان دهنده اينرسي حرکت ذره مي باشد. عموما r1 و r2 از توزيع يکنواخت به صورت تصادفي تعيين شده و c1 و c2 به صورت برابر معادل 2 در نظر گرفته مي شوند. در الگوريتم بهينه سازي ازدحام ذرات، تعداد np ذره به صورت تصادفي ايجاد مي کنيم. براي هر ذره هزينه Ci را در نظر گرفته و بر اساس معادله (3) ذرات را در هر مرحله به سمت بهينگي حرکت مي دهيم. در مرحله اول xgb را بهترين ذره انتخاب مي کنيم. پس از حرکت دادن ذره ها چک مي کنيم موقعيت جديد از بهترين نقطه محلي قبلي بهتر شده است. بهترين نقطه محلي را به موقعيت جديد تبديل مي کنيم (موقعيت را به روز رساني مي کنيم) در غير اينصورت وضعيت قبلي را حفظ مي کنيم. به همين ترتيب براي بهترين نقطه جهاني بهترين نقطه در مجموعه داده شده ذرات را در نظر مي گيريم. همين ترتيب مراحل را ادامه مي دهيم تا به يک شرط توقف مثلا به هدف خاصي يا تعداد ذره مشخصي براي حرکت برسيم. به صورت کلي مي توان اين الگوريتم را به صورت شبه کد REF _Ref412629882 \h \* MERGEFORMAT جدول شماره ‏34 نمايش داد: جدول شماره STYLEREF 1 \s ‏3 SEQ جدول_شماره_ \* ARABIC \s 1 4 : شبه کد الگوريتم ازدحام ذرات For each particle{ Initialize particle}Do until maximum iterations or minimum error criteria{ For each particle { Calculate Data fitness value If the fitness value is better than pBest { Set pBest = current fitness value } If pBest is better than gBest { Set gBest = pBest } } For each particle { Calculate particle Velocity Use gBest and Velocity to update particle Data } 3-3-3-3 الگوريتم رقابت استعماري الگوريتم رقابت استعماري CITATION Ata07 \l 1065 [21] مدلسازي رياضي تکامل اجتماعي است. اکثر الگوريتمهاي بهينه سازي تکاملي شبيه سازي فرايندهاي طبيعي هستند مانند ژنتيک، تبريد شبيه سازي شده. تکامل انساني جنبه هاي ديگري غير از تکامل زيستي دارد مثل جنبه هاي اجتماعي، فکري و سياسي-اجتماعي. تکامل اين جنبه، الهام پيشنهاد الگوريتم رقابت استعماري است. الگوريتم رقابت استعماري از همان نقطه شروع مسيري متفاوت از ساير الگوريتمها را طي مي کند. حل ها يا عضوهاي جمعيت را به صورت کشورها مي شناسد و با شبيه سازي رفتار کشورها روندي، پروسه اي را براي بهتر کردن جواب مساله طي مي کند. رويکرد تکامل کشورها از جنبه سياسي-اجتماعي متفاوت از تکامل انسانها از جنبه زيستي مي باشد. هسته هاي اصلي الگوريتم رقابت استعماري عبارتند از تابع همگون سازي که بر گرفته از آن است که کشورهاي استعمارگر، مستعمره ها را با زبان آموزي خود و ... شبيه خود مي کنند و رقابت استعماري، همان رقابت کشورهاي استعمارگر براي جذب مستعمرات مي باشند. انقلاب تغيير ناگهاني در يک گونه سياسي- اجتماعي مي باشد. فازهاي اصلي الگوريتم رقابت استعماري عبارتند از : تعيين امپراطوري ها (استعمارگرها) : تعدادي از حلها که به اين عنوان انتخاب مي شوند. جذب: حرکت کلوني ها به سمت امپرياليست ها کنترل اينکه کلوني بهتر از امپرياليست است؟ (اگر خير مرحله 3 انجام نمي شود) جابجايي کلوني با امپرياليست محاسبه هزينه کل امپراطوري مستعمره هاي ضعيف تر مورد رقابت ساير امپراطوري ها قرار مي گيرند. (رقابت استعماري) حذف امپراطوري که کلوني هايش را از دست مي دهد. کنترل شرط توقف (در صورت عدم تحقق برو به مرحله 2) در اجراي اين الگوريتم در ابتدا آرايه اي از متغيرهاي بهينه سازي تشکيل مي دهيم. به عنوان مثال هر کشور را به صورت مجموعه مرتبي از p1, p2, …, pn که در آن متغيرها فرهنگ، سياست اقتصادي، ... و زبان مي باشند در نظر مي گيريم. در حل مساله بهينه سازي به دنبال بهترين کشور هستيم يعني بهترين دسته پارامترهاي مساله . قدرت (هزينه) هر يک از امپرياليست ها که به کمک معادله (4) مي يابيم. معادله (4)Cn=cn-maxici که در آن cn هزينه امپرياليست n ام مي باشد و Cn هزينه نرمال شده آن مي باشد. بدين ترتيب هزينه نرمال شده هر يک از امپرياليست ها به صورت معادله (5) خواهد بود: معادله (5)Pn=Cni=1NimpCi قدرت نسبي يک امپرياليست برابر نسبت کلوني هايي است که دارا مي باشد لذا مي توان تعداد اوليه کلوني هاي يک امپراطوري را به صورت معادله (6) محاسبه نمود: معادله (6)N.Cn=roundpn.Ncol که در آن N.Cn تعداد اوليه کلوني هاي امپرياليست n ام بوده و Ncol تعداد کل کلوني ها مي باشد. براي تقسيم کلوني ها به هر امپرياليست به صورت تصادفي N.Cn عدد از کلوني ها را انتخاب و به امپرياليست تخصيص مي دهيم. REF _Ref412629909 \h \* MERGEFORMAT شکل شماره ‏39 نمونه اي از تقسيم کلوني ها به امپرياليست ها را نمايش مي دهد. شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 9: نمايش نمونه اي تقسيم کلوني ها به امپرياليست ها حرکت کلوني ها به امپراطوري از طريق امپرياليست ها از طريق فعاليت امپرياليست ها در بهبود کلوني هايشان محقق مي شود. اين حرکت ترکيبي و همزمان از يک حرکت خطي و حرکت زاويه اي به سمت امپرياليست مي باشد. در حرکت خطي مطابق REF _Ref412629924 \h \* MERGEFORMAT شکل شماره ‏310 کلوني x واحد به سمت امپرياليست حرکت مي کند. اندازه حرکت بر اساس توزيع يکنواختي که شامل فاصله کلوني و امپرياليست است مي باشد. شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 10: حرکت خطي کلوني حرکت زاويه اي کلوني که باعث جستجوي نقاط بيشتري در اطراف امپرياليست مي شود با اعمال انحراف معادل ɵ در مسير حرکت خطي به صورت همزمان اعمال مي شود. اندازه اين انحراف نيز از يک توزيع يکنواخت تعيين مي شود ولي عموما π4 در نظر گرفته مي شود. REF _Ref412629939 \h \* MERGEFORMAT شکل شماره ‏311 حرکت زاويه اي کلوني را نمايش مي دهد. شکل شماره STYLEREF 1 \s ‏3 SEQ شکل_شماره_ \* ARABIC \s 1 11: حرکت زاويه اي کلوني انقلاب فرايند جابجايي کلوني ها به سمت امپرياليست ها مطابق روش شرح داده شده قبل مي باشد که قبل يا بعد از مرحله 2 اجرا مي شود. در مراحل بعدي پس از انقلاب هزينه هر يک از امپراطوري ها محاسبه شده و مستعمره هاي ضعيف تر در فرايند رقابت استعماري به استعمار ساير امپراطوري ها در مي آيند. به صورت کلي مي توان اين الگوريتم را به صورت شبه کد REF _Ref412629959 \h \* MERGEFORMAT جدول شماره ‏35 نمايش داد: جدول شماره STYLEREF 1 \s ‏3 SEQ جدول_شماره_ \* ARABIC \s 1 5 : شبه کد الگوريتم رقابت استعماري 0) Define objective function: 1) Initialization of the algorithm. Generate some random solution in the search space and create initial empires. 2) Assimilation: Colonies move towards imperialist states in different in directions. 3) Revolution: Random changes occur in the characteristics of some countries. 4) Position exchange between a colony and Imperialist. A colony with a better position than the imperialist, has the chance to take the control of empire by replacing the existing imperialist. 5) Imperialistic competition: All imperialists compete to take possession of colonies of each other. 6) Eliminate the powerless empires. Weak empires lose their power gradually and they will finally be eliminated. 7) If the stop condition is satisfied, stop, if not go to 2.8) End فهرست منابع BIBLIOGRAPHY \l 1065 [1] Wu Ming-Tao, Econ Coll, "The research on stock price forecast model based on data mining of BP neural networks," in Intelligent System Design and Engineering Applications (ISDEA), 2013. [2] مسعود فرکي، محمدحسين سرائي، شهرام کيخاني, “يک مورد کاوي موردي پارامترهاي مدل پيش بيني قيمت سهام با استفاده از الگوريتم انتشار بازگشتي,” در اولين کنفرانس داده کاوي ايران, 1386. [3] پيام حنفي زاده، ابوالفضل جعفري, “مدل ترکيبي شبکه عصبي مصنوعي پيشخور و خودسازمانده کوهونن براي پيش بيني قيمت سهام,” مطالعات مديريت صنعتي, جلد شماره 19, شماره سال هشتم, 1389. [4] Debashish Das, Mohammad Shorif Uddin, "Data mining and neural network techniques in stock market prediction: A methodological review," International journal of artificial intelligence and application, vol. 4, no. 1, pp. p117-127, Jan 2013. [5] Jianfeng Li, Jun Zhai, Junfeng Guo, "Relative value mining in stock market based on fuzzy clustering method," CCA2013, vol. ASTL Vol 17, pp. p 112-115, 2013. [6] رضا حافظي، جمال شهرابي، اسماعيل هداوندي, “توسعه ي مدلي ترکيبي هوشمند براي پيش بيني بازار سهام تهران,” مجله تحقيق در عمليات و کاربردهاي آن, جلد شماره دوم, شماره سال دهم, 1392. [7] M.H.Fazel Zarandi, E.Hadavandi, I.B.Turksen, "A hybrid fuzzy intelligent agent-based system for stock price prediction," International journal of intelligent system, vol. 00, pp. p 1-23, 2012. [8] Dyckman, T., Philbrick, D., Stephan, J., "A comparison of event study methodologies using daily stock returns: A simulation approach," Journal of Accounting Research, pp. p 1-30, 1984. [9] Malkiel, Burton G., and Richard E. Quandt, "The supply of money and common stock prices: Comment," The Journal of Finance, pp. p 921-926., 1972. [10] Kaastra, I., & Boyd, M., "Designing a neural network for forecasting financial and economic time series," Neurocomputing, pp. p 215-236., 1996. [11] Rezaiedolatabadi, H., Sayadi, S., Hosseini, A., Forghani, M., & Shokhmgar, M., "Modeling and Forecasting Stock Prices Using an Artificial Neural Network and Imperialist Competitive Algorithm," International Journal of Academic Research in Accounting, pp. p 296-3-2, 2013. [12] محمود يحيي زاده فر، اسماعيل ابو نوري، هومن شبابي, “بررسي اثر روزهاي هفته بر بازده سهام بورس اوراق بهادار تهران و مقايسه ي آن با ساير بازارهاي نوظهور,” مجله علوم اجتماعي و انساني دانشگاه شيراز, شماره شماره 43, p. صفحه 169 تا 195, 1384. [13] رضا راعي، سعيد شيرزادي, “بي قاعدگي هاي تقويمي و غير تقويمي در بازارهاي مالي,” فصلنامه بورس اوراق بهادار, جلد شماره 1, شماره سال اول, p. صفحه 101 تا 132, 1387. [14] محسن نظري، الهام فرزانگان, “بي قاعدگي هاي دوره اي در بازدهي سهام عادي بورس اوراق بهادار,” نشريه تحقيقات مالي, جلد شماره 31, p. صفحه 147 تا 167, 1390. [15] فاطمه بزازان، شمس ا... شيرين بخش ماسوله، سولماز صفري, “بررسي اثرات روزهاي هقته بر بازده سهام رويکرد رگرسيون فازي گارچ بوت استرپ,” فصلنامه علمي پژوهشي دانش مالي تحليل اوراق بهادار, شماره شماره 13, p. صفحه 99 تا 110, 1391. [16] شمس ا... شيرين بخش ماسوله، سولماز صفري, “بررسي اثرات روزهاي هفته بر بازده سهام - الگوريتم رگرسيون حداقل ميانگين مربعات (LSM),” مجله مهندسي مالي و مديريت اوراق بهادار, شماره شماره 17, p. صفحه 45 تا 59, 1392. [17] جمال شهرابي, داده کاوي, تهران: انتشارات جهاد دانشگاهي واحد صنعتي اميرکبير, 1392. [18] Hagan, M. T., Demuth, H. B., Beale, M. H., Neural Network Design, Boston: Pws Pub., 1996. [19] Paul J. Werbos, The Roots of Backpropagation. From Ordered Derivatives to Neural Networks and Political Forecasting, New York: John Wiley & Sons, Inc., 1994. [20] J. S. Goetti, A.W. Brugh, B. A. Julstrom, "Arranging the Keyboard with a Permutaion-Coded Genetic Algorithm," in Proc. of the 2005 SCM Symposium on Applied Computing, 2005. [21] Atashpaz-Gargari, E., Lucas, C., "Imperialist competitive algorithm: an algorithm for optimization inspired by imperialistic competition," in IEEE 2007, 2007. SHIRAZ UNIVERSITY FACULTY OF ELECTRICAL LEARNING M.Sc.THESIS IN IN INFORMATION TECHNOLOGY ENGINEERING (MANAGEMENT OF INFORMATION SYSTEMS) SHARE PRICE FORECASTING THROUGH DATA MINING WITH COMBINATORY EVOLUTIONARY ALGORITHMS BY MOHSEN NOROUZI MOVAHED SUPERVISED BY Prof., SATTAR HASHEMI MARCH 2015

فایل های دیگر این دسته

مجوزها،گواهینامه ها و بانکهای همکار

فروشگاه زرچوبه دارای نماد اعتماد الکترونیک از وزارت صنعت و همچنین دارای قرارداد پرداختهای اینترنتی با شرکتهای بزرگ به پرداخت ملت و زرین پال و آقای پرداخت میباشد که در زیـر میـتوانید مجـوزها را مشاهده کنید