صفحه محصول - پروپوزال شخصی سازی تبلیغات اینترنتی با دیتا ماینینگ

پروپوزال شخصی سازی تبلیغات اینترنتی با دیتا ماینینگ (docx) 1 صفحه


دسته بندی : تحقیق

نوع فایل : Word (.docx) ( قابل ویرایش و آماده پرینت )

تعداد صفحات: 1 صفحه

قسمتی از متن Word (.docx) :

2330929-508958 وزارت علوم، تحقیقات و فناوری دانشگاه علوم و فنون مازندران پایان نامه مقطع کارشناسی ارشد رشته : مهندسی فناوری اطلاعات عنوان : ارائه یک مدل جهت شخصی سازی تبلیغات اینترنتی با استفاده از تکنیک داده کاوی اساتید راهنما : دکتر بابک شیرازی دکتر ایرج مهدوی استاد مشاور : دکتر حسین مومنی دانشجو : علی مقدم خراسانی ( تابستان 1391 ) تقدیم و سپاسگذاری ضمن تقدیم این پایان نامه به پدر و مادر مهربانم، از تلاش ها و راهنمایی های دلسوزانه اساتید راهنمای محترم، آقای دکتر شیرازی و آقای دکتر مهدوی تشکر فراوان دارم.همچنین از نکات و راهنمایی های استاد مشاور محترم، آقای دکتر مومنی تشکر می نمایم. چکیده : به دلیل بازار رقابتی شدیدی که امروزه در تجارت الکترونیک وجود دارد شرکت های تجاری در تلاش هستند تا شرایط مدیریت ارتباط با مشتری را هرچه بیشتر بهبود بخشند تا بتوانند مشتریان فعلی را حفظ و دیگر مشتریان را هم جذب کنند.به همین خاطر است که شرکت هایی که کالاهای خود را بصورت اینترنتی به فروش می رسانند به دنبال این هستند تا تبلیغات کالاهایشان بر اساس ترجیحات فردی مشتریان باشد، یعنی تبلیغات را برای هر مشتری شخصی سازی کنند. برای شخصی سازی تبلیغات شرکت ها باید اطلاعاتی در مورد رفتار خرید پیشین مشتریانشان کسب کنند و بعد از آن این اطلاعات را تجزیه و تحلیل کنند تا بتوانند رفتار خرید آتی مشتریان را پیش بینی کنند. تکنیک داده کاوی ابزاری است که می تواند به شرکت ها کمک کند تا بتوانند اطلاعات رفتار خریدهای پیشین مشتری را تجزیه و تحلیل کرده و قوانینی را استنتاج کنند که برای پیش بینی رفتار خرید آتی مشتری مفید باشند و بر طبق آن بتوانند راهبردهای شخصی سازی تبلیغات برای مشتریان را برپا کنند. ما در تحقیق خود از داده های جمع آوری شده از مشتری، که رفتار خریدهای پیشین مشتری هستند، استفاده کرده و با بکارگیری روش تاخر، تناوب و مالی ارزش مشتریان را برای شرکت مشخص کردیم.سپس برای خوشه بندی مشتریان بر اساس ارزش آنها، بصورت موازی از الگوریتم خوشه بندی K-Means و K-Harmonic Means استفاده کردیم سپس از الگوریتم استقرایی که یکی از الگوریتم های کشف قوانین وابستگی است استفاده کردیم و تکنیک قوانین وابستگی را بر روی داده های مربوط به هر یک از خوشه هایی که توسط K-Means مشخص شده اند بکار گرفتیم. با استفاده از قوانین بدست آمده از هر خوشه راهبردهای شخصی سازی تبلیغات برای هر خوشه از مشتریان را مشخص کردیم. برای هر مشتری علاوه بر قوانین مربوط به خوشه اصلی که به آن تعلق دارد از قوانین خوشه های دیگری که درجه تعلق مناسبی نسبت به آنها دارد نیز برای تعیین راهبردهای شخصی سازی تبلیغات استفاده کردیم تا بدین ترتیب تعداد تبلیغات پیشنهادی که مطابق با علایق مشتری است را بیشتر کنیم. Abstract : Due to intense competitive market that exist in electronic commerce, these days, commercial firms are trying to promote their customer relationship management ( CRM ) situations in order to keep their own and attract other customers, therefore, the firms that sell their products electronically and via internet, try to advertise their products based on their customers personal priorities, that means they personalize the advertisement for each customer. For this propose, they should collect some information about their customers previous purchases behaviour and analyze them to be able to predict customers future purchase behavior.Data mining techniques can help these firms to analyze customers previous purchases behavior in order to extract some rules that are used for predicting of customers future purchases behavior and setting up the advertisement personalizing strategies.In this research we used some data, collected from and about the customers and their previous purchases behaviour.By using Recency, Frequency and Monetary ( RFM ) method we determined each customers value for firms.Then, for clustering the customers based on their values and in a parallel mode, we used K-means and K-Harmonic means clustering algorithms, afterwards, we use apriori algorithm ( that is one of association rules discovery algorithms ), on the data related to each cluster determined by K-means.We were able to determine the advertisement personalizing strategies for each cluster of customers by using the rules gained from each cluster.In addition to rules related to original cluster that a customer belongs to, we used the rules from other clusters by appropriate membership degree for that customer to determine the advertisement personalizing strategies,hence we were able to increase the number of proposed advertisement according to customers interests. فهرست مطالب: عنوان .......................................................................................................... صفحه فصل اول: مقدمه و کلیات تحقیق 1-1: مقدمه .......................................................................................................... 2 1-2: بیان مسئله .................................................................................................. 3 1-3: هدف تحقیق ................................................................................................ 4 1-4: اهمیت تحقیق ............................................................................................... 6 1-5: ساختار تحقیق .............................................................................................. 7 فصل دوم: پیشینه و مفاهیم تحقیق 2-1: مبانی نظری................................................................................................... 10 2-1-1: مدیریت ارتباط با مشتری................................................................ 10 2-1-1-1: تعریف مدیریت ارتباط با مشتری ................................................... 10 2-1-1-2: تبلیغات اینترنتی ..................................................................... 13 2-1-2: داده کاوی ................................................................................................ 15 2-1-2-1: تعریف داده کاوی ................................................................................. 15 2-1-2-2: خوشه بندی ........................................................................................ 18 2-1-2-3: قوانین وابستگی ................................................................................. 25 2-1-3: شیوه تاخر، تناوب و مالی ......................................................................... 31 2-2: پیشینه تحقیقاتی ...................................................................................... 33 فصل سوم: روش شناسی تحقیق 3-1: مقدمه ......................................................................................................... 40 3-2: اطلاعات مجموعه داده ها و آماده سازی داده ................................................ 42 3-3: تعیین ارزش مشتری ................................................................................... 44 3-4: استفاده از تکنیک های داده کاوی ............................................................... 48 3-5: رهیافتی برای شخصی سازی تبلیغات .......................................................... 56 3-6: روش ارزیابی ............................................................................................. 59 فصل چهارم : محاسبات و یافته های تحقیق 4-1 : پایگاه داده هدف ........................................................................................ 62 4-2 : آماده سازی مجموعه داده .......................................................................... 63 4-3 : استخراج اطلاعات جهت تعیین معیارهای RFM .......................................... 78 4-4 : داده کاوی ................................................................................................. 82 4-5 : ارائه تبلیغات مناسب به مشتری ................................................................. 117 4-6 : ارزیابی مدل .............................................................................................. 119 فصل پنجم : نتیجه گیری و کار آینده 5-1 : نتیجه گیری .............................................................................................. 126 5-2 : پیشنهادها و کار آینده ............................................................................. 128 منابع ................................................................................................................ 131 فهرست شکل ها: عنوان .......................................................................................................... صفحه شکل 3-1 : فرایند شخصی سازی تبلیغات توسط داده کاوی ................................................... 41 شکل 3-2 : قالب کاری سیستم ارائه تبلیغ در سایت .................................................................. 58 شکل 4-1 : قالب داده های مربوط به خوشه شماره یک در WEKA ..................................... 107 شکل 4-2 : قالب داده های مربوط به خوشه شماره دو در WEKA ....................................... 110 شکل 4-3 : قالب داده های مربوط به خوشه شماره سه در WEKA ...................................... 114 فهرست جدول ها: عنوان .......................................................................................................... صفحه جدول 2-1 : مثال تراکنش های خرید ........................................................................................... 26 جدول 2-2 : مثال معیاردهی RFM ............................................................................................... 33 جدول 3-1 : مشخصات کالاهای موجود ........................................................................................ 43 جدول 3-2 : ارزش گذاری معیار Recency ................................................................................ 46 جدول 3-3 : ارزش گذاری معیار Monetary ............................................................................ 47 جدول 3-4 : مثال نحوه تخصیص RFM ........................................................................................ 48 جدول 4-1 : رکوردهای خرید مشتریان .......................................................................................... 63 جدول 4-2 : تخصیص مقادیر RFM ............................................................................................... 79 جدول 4-3 : شماره خوشه مشتریان در K-means ................................................................... 83 جدول 4-4 : رکوردهای خرید مشتریان پس از ویرایش .............................................................. 92 جدول 4-5 : نتایج پیشنهادها و عرضه تبلیغات کالاها به مشتریان ........................................... 120 فصل اول: مقدمه و کلیات تحقیق 1-1 مقدمه: پیشرفت فناوری های اطلاعات و ارتباطات، حجم وسیعی از اطلاعات و داده های مفید را در دسترس قرار داده است.با توجه به رشد روز افزون بازار خرید اینترنتی و رقابت شدید بین شرکت ها و سایت های فروش اینترنتی، استفاده بهینه از اطلاعات بازار و مشتری اهمیت ویژه ای پیدا کرده است. ایده ها و راه حل های گوناگونی برای استفاده از اطلاعات بدست آمده از بازار و مشتریان جهت جذب مشتری و مهمتر از آن جهت نگهداری مشتریان فعلی پدید می آیند که یکی از این ایده ها، استفاده از اطلاعات مشتری برای بدست آوردن و پیش بینی کردن علایق آن است.فرایندهای زیادی را می توان برای بدست آوردن علایق مشتریان متصور شد، اما یکی از این فرایندها که امروزه با استقبال زیادی از سوی شرکت های تجاری و صاحبان سایت های فروش اینترنتی مواجه شده است، استفاده از تکنیک های داده کاوی1 می باشد. با استفاده از تکنیک خوشه بندی2 و تکنیک قوانین انجمنی3 که از تکنیک های داده کاوی به شمار می آیند و بر روی داده های مربوط به رفتار خرید پیشین مشتری اعمال می شوند، می توان اطلاعات مفیدی جهت پیش بینی رفتار خرید آتی مشتری کسب نمود.شرکت ها از این اطلاعات استفاده می کنند تا بتوانند کالاهای مورد علاقه مشتریان را در مکان و زمان مناسب به آنها پیشنهاد دهند و بدین ترتیب در جهت سیاست نگهداری و حفظ مشتریان گام بردارند. 1-2 بیان مسئله: به خاطر بازار رقابتی شدیدی که امروزه در تجارت الکترونیک وجود دارد شرکت های تجاری در تلاش هستند تا شرایط مدیریت ارتباط با مشتری1 را هرچه بیشتر بهبود بخشند تا بتوانند هرچه بیشتر مشتریان فعلی را حفظ کنند و همچنین دیگر مشتریان را هم جذب کنند. یکی از راه هایی که برای این اهداف شرکت ها و صاحبان کالا مصور است تبلیغ کالاها یا خدماتی است که مشتریان علاقه بیشتری به خرید یا دریافت آنها دارند. بنابراین شرکت ها باید به دنبال این باشند تا تبلیغاتشان بر اساس ترجیحات فردی مشتریان باشد، یعنی تبلیغات را برای هر مشتری شخصی سازی2 کنند. شرکت های تجاری برای اینکه بتوانند تبلیغات را برای مشتریان خود شخصی سازی کنند نیاز دارند تا اطلاعاتی در مورد علایق این مشتریان بدست آورند. بعضی از آنها برای بدست آوردن این اطلاعات از روش پرسشنامه استفاده می کنند و در ابتدای ارتباط با مشتری پرسش هایی در مورد شخص مشتری از قبیل سن و جنسیت و ... از او می پرسند. بعلاوه همچنین ممکن است سوالاتی در مورد علایق خرید مشتری نیز از او پرسیده شود.این روش می تواند برای مشتری آزاردهنده و وقت گیر باشد، از این رو ممکن است مشتری عملیات خرید خود از سایت را متوقف کند.روش دیگری که برای جمع آوری اطلاعات مورد نیاز درباره علایق مشتری وجود دارد استفاده از داده های مورد استفاده پیشین کاربر از وب1 می باشد که با استفاده از این داده ها و بررسی آنها شرکت ها می توانند اطلاعاتی در مورد رفتار خرید کاربران بدست آورند. داده کاوی ابزاری است که به شرکت ها کمک می کند تا ترجیحات و علایق فردی کاربران و مشتریان را بر اساس داده های به جای گذاشته شده از آنها استخراج کنند و بر این اساس استراتژی های بازاریابی خود را برقرار کنند و به شخصی سازی تبلیغات بپردازند. شرکت ها با استفاده از ابزارهای داده کاوی ابتدا داده های مورد نیاز برای کاوش رفتار خرید مشتری را آماده می کنند و با استفاده از الگوریتم های متعدد خوشه بندی می توانند مشتریان خود را بخش بندی کنند.بعد از آن می توانند با استفاده از الگوریتم های کاوش قوانین وابستگی، قوانینی برای پیش بینی رفتار خرید آتی مشتری بدست آورند و با استفاده از این قوانین، راهبردها و روش های شخصی سازی تبلیغات برای مشتری را مشخص کنند. ما درصدد هستیم تا با استفاده از تکنیک های داده کاوی، مشتریان را بر اساس ارزش آنها که از رفتار خرید گذشته آنها بدست می آید دسته بندی و گروه بندی کنیم و علایق و رفتار خرید آینده هر دسته از این گروه ها را پیش بینی و مشخص کنیم تا با استفاده از این بتوانیم تبلیغات کالا را برای هر مشتری شخصی سازی کنیم. 1-3 هدف تحقیق: در تحقیقاتی که تا به حال انجام گرفته با خوشه بندی مشتریان را به گروه هایی تقسیم می کنند و بر روی هر یک از این گروه ها تکنیک قوانین انجمنی را بکار می برند تا رفتار خرید آینده هر مشتری را پیش بینی کنند.برخی از این تحقیقات از الگوریتم k-means برای خوشه بندی مشتریان استفاده کردند و برخی دیگر به دلیل اشکالاتی که در این الگوریتم وجود دارد از الگوریتم هایی دیگر یا بهبودی از این الگوریتم استفاده کردند. هدف از این تحقیق مشخص کردن ارزش مشتریان برای شرکت ها بر اساس رفتارهای خرید آنان، شخصی سازی تبلیغات اینترنتی برای مشتریان و ارائه حداکثری تبلیغات اینترنتی مطابق با علایق هر مشتری می باشد.برای این منظور از خوشه بندی موازی مشتریان توسط دو الگوریتم k-means و k-harmonic means و بکار گیری الگوریتم استقرایی1 روی هر یک از خوشه های حاصل شده از خوشه بندی k-means استفاده شده است. و بعد از آن از نتایج بدست آمده از بکارگیری الگوریتم استقرایی برای هر یک از مشتریان، با توجه به درجه تعلق آنها به هر خوشه ( که توسط الگوریتم k-harmonic means مشخص شده است ) برای شخصی سازی تبلیغات برای آنان استفاده می شود. قوانین وابستگی یا انجمنی استخراج شده از هر خوشه برای هر مشتری که درجه عضویت حداقلی مشخص شده از قبل را برای آن خوشه دارد معتبر در نظر گرفته می شود.بنابر این قوانین وابستگی برای یک مشتری تنها به قوانین استخراج شده از خوشه ای که مشتری بیشترین درجه تعلق به آن را دارد محدود نمی شود.با توجه به احتمال تداخل قوانین بین خوشه ها برای مشتری، اولویت با قوانین خوشه ای است که مشتری درجه عضویت بالاتری را برای آن دارد. بدین ترتیب با افزایش قوانین استخراج شده معتبر مربوط به هر مشتری می توان انتظار داشت که راهبردهای بیشتری برای شخصی سازی تبلیغات برای مشتری بوجود بیاید.این بدین معنا است که می توان کالاهای بیشتری را بر اساس علایق کاربر به او پیشنهاد کرد. 1-4 اهمیت تحقیق: امروزه کاربران و مشتریان در محیط اینترنت ترجیح می دهند تا کالاها یا خدماتی که به آنها پیشنهاد می شود بر اساس ترجیحات و علایق شخصی آنها باشد.در اغلب تحقیقاتی که در زمینه شخصی سازی تبلیغات اینترنتی برای مشتریان با استفاده از تکنیک های داده کاوی صورت گرفته است، هر مشتری فقط به یک خوشه تعلق پیدا می کند و در نتیجه تنها پیشنهاداتی به او عرضه می شود که در نتیجه بکار بردن تکنیک قوانین انجمنی تنها بر روی همان خوشه ای که به آن تعلق داشته، بدست آمده اند. تحقیق ما از این نظر نسبت به دیگر تحقیقات از اهمیت بیشتری برخوردار است که هر مشتری تنها به یک خوشه تعلق پیدا نمی کند و قوانین با احتمال زیاد خوشه های دیگر که این مشتری درجه تعلق حداقلی از قبل مشخصی را نسبت به آنها دارد، برای مشتری بکار گرفته می شود. اهمیت و ارزش این کار در این است که نسبت به روش های قبلی می توان پیشنهادات بیشتری بر حسب علایق مشتری به او عرضه کرد. بطور معمول اگر برای رفتار خرید فعلی مشتری قانون خاصی از قبل استخراج نشده و راهبردی وجود نداشته باشد، یا کالایی به او پیشنهاد نمی شود یا به صورت تصادفی یک کالا به مشتری پیشنهاد می شود. اما اگر قانونی مربوط به یک خوشه دیگر که مشتری درجه تعلق معتبری ( یک درجه تعلق حداقلی از قبل مشخص شده ) نسبت به آن داشته باشد موجود باشد آنگاه می توان پیشنهاد یک کالای مربوط به رفتار خرید فعلی مشتری به او عرضه کرد. هرچند تخصیص درجه تعلق برای هر خوشه به مشتری، توسط الگوریتم معروف Fuzzy C-Means نیز انجام می شود، اما به علت مشکل مهمی که در این الگوریتم وجود دارد که همان حساس بودن به مقدار دهی اولیه مراکز خوشه و در دام مینیمم محلی1 قرار گرفتن است، استفاده از الگوریتم K-Harmonic Means که این مشکل برای آن وجود ندارد را ترجیح داده ام. 1-5 ساختار تحقیق: ساختار این پایان نامه در فصول بعدی به شرح زیر است: در فصل دوم، ابتدا برای آشنایی بیشتر با حوزه تحقیق به تعریف و تشریح مدیریت ارتباط با مشتری و تبلیغات اینترنتی و همچنین به تعریف و بررسی داده کاوی و تعریف دو تکنیک مهم آن که در این تحقیق مورد استفاده قرار گرفته است یعنی خوشه بندی و قوانین وابستگی می پردازیم.همچنین شیوه تاخر، تناوب و مالی2 که یک شیوه برای تعیین ارزش و ارزش دهی به مشتری می باشد را تعریف کرده ایم.در انتهای این فصل یک پیشینه تحقیقاتی در مورد حوزه تحقیق آورده شده است. در فصل سوم شیوه و روش کار و تحقیق این پایان نامه ذکر شده است.فصل چهارم به شرح پیاده سازی و اجرای این کارمی پردازد و در نهایت در فصل پنجم به بررسی نتایج می پردازیم و پیشنهادهایی برای کار آینده ارائه می شود. روش شناسی تحقیق 3-1 مقدمه: همانطورکه در قبل اشاره گردید رهیافت ها و راه حل های فراوانی برای دستیابی به علایق مشتریان جهت ارائه خدمات و یا عرضه محصولات به مشتریان بر اساس این علایق مطرح گردید که از جمله آنها رهیافت مبتنی بر داده کاوی اطلاعات خریدهای قبلی مشتریان می باشد.طبق مطالعاتی که صورت گرفت، دیدیم که بیشتر تحقیقاتی که در این زمینه انجام شد و مورد استفاده قرار گرفت از الگوریتم خوشه بندی K-Means جهت دسته بندی مشتریان و کاربران استفاده شد.اما به خاطر عیوبی که این الگوریتم دارا می باشد و همچنین عدم فازی بودن این الگوریتم ( که منجر به اختصاص دادن هر مشتری تنها به یک خوشه می شود ) ما به ارائه یک مدل جدید که به اصلاح این عیوب نیز می پردازد علاقه مند شدیم که این مدل و فرایندهای آن در ادامه این فصل بصورت مرحله به مرحله مورد بررسی قرار گرفته است. شکل (3-1) شمای کلی مدل و فرایندهایی که در آن وجود دارند را نشان می دهد: آماده سازی داده ها مقیاس دهی و تعیین ارزش مشتری با استفاده از معیار RFM خوشه بندی توسطK-Meansخوشه بندی توسط K-Harmonic Means بکارگیری الگوریتم استقرایی و استخراج قوانین استنتاجی استفاده از قوانین استخراج شده جهت شخصی سازی تبلیغات برای هر مشتری با توجه به درجه تعلق آنها به هر خوشه شکل3-1: فرایند شخصی سازی تبلیغات توسط داده کاوی مرحله اول مرحله آماده سازی داده ها می باشد و بعد از آن ارزش مشتریان با استفاده از معیار تاخر، تناوب و مالی مقیاس دهی و تعیین می شود.با توجه به این ارزش های تعیین شده، مشتریان بصورت موازی با الگوریتم های K-Means و K-Harmonic Means خوشه بندی می شوند.الگوریتم K-means بصورت قطعی و خاص مشخص می سازد هر مشتری به کدام خوشه تعلق دارد و الگوریتم استقرایی بر روی هر کدام از خوشه های منتج شده از K-Means اعمال می شود و قوانینی درمورد رفتار خرید مشتریان مربوط به هر خوشه استخراج می کند.در مرحله آخر برای استفاده از این قوانین جهت شخصی سازی تبلیغات برای مشتریان، قوانین هر خوشه را برای هر مشتری که در خوشه بندی K-Harmonic Means دارای درجه تعلق حداقلی مشخصی نسبت به آن خوشه می باشد معتبر در نظر گرفته و از آن استفاده می کنیم. 3-2 اطلاعات مجموعه داده ها و آماده سازی داده: در این تحقیق از یک مجموعه داده مربوط به یک سایت خرده فروشی اینترنتی استفاده شد. این مجموعه داده طوری طراحی شده است که مشخصات هر کاربر و مشخصات هر خریدی که در سایت انجام می دهد ثبت شود.در این مجموعه داده 10 کالا برای خرید توسط مشتریان وجود دارد که مشخصات آنها در جدولی به نام محصولات در پایگاه داده ثبت شده است و همچنین بخشی از این مشخصات در جدول ( 3-1 ) آمده است. بعد از هر خرید، اطلاعات مربوط به آن خرید که تاریخ خرید، نوع کالا و مشخصات مشتری می باشد در جدولی به نام جدول خرید ثبت می شود.مشخصات مربوط به هر مشتری نیز پس از ثبت نام وی در سایت در جدولی به نام مشتری درج می گردد. برای راحتی کار به هر کالا یک حرف از حروف الفبای انگلیسی را اختصاص داده شد تا به جای نام آن بکار برده شود که در جدول ( 3-1 ) آمده است. جدول 3-1 : مشخصات کالاهای موجود شماره کالانام کالاقیمت کالا1دست بند مغناطیسی ( A )20002جا سوئیچی ( B )20003مچ بند ورزشی ( C )20004عطر ( D )50005روسری سنتی ( E )50006تابلو ( F )50007آلبوم عکس ( G )50008گلدان ( H )50009ساعت مچی ( I )1000010تی شرت مردانه ( Z )10000 برای این تحقیق نیاز به آن وجود داشت که مجموعه داده ها ویژگی های زیر را داشته باشند: 1. هر مشتری در هر جلسه کاری بیش از یک خرید انجام داده باشد. 2. تاریخ آخرین خرید هر مشتری از سایت مشخص باشد. 3. تعداد دفعات خرید هر مشتری از سایت مشخص باشد. 4. کل مبلغی که هر مشتری در سایت خرج کرده است مشخص باشد. تاریخ آخرین خرید هر مشتری از سایت را می توان به راحتی از جدول خرید بدست آورد، همچنین با شمارش تعداد رکوردهای مربوط به هر مشتری در جدول خرید می توان تعداد دفعات خرید هر مشتری از سایت را نیز مشخص کرد و با جمع کردن مبلغ هر خرید توسط هر مشتری می توان مشخص کرد که هر مشتری چه مبلغی را در سایت خرج کرده است. اما برای اینکه تنها داده هایی را داشته باشیم که در آنها هر مشتری درهر جلسه کاری بیش از یک خرید انجام داده باشد، نیاز داریم تا تمام رکوردهایی که در آنها هر مشتری در یک جلسه کاری تنها یک خرید انجام داده است را از پایگاه داده خود حذف کنیم و بدین صورت به آماده سازی داده ها جهت اعمال روش تاخر، تناوب و مالی بر روی آنها و همچنین استخراج قوانین استنتاجی از آنها می پردازیم. 3-3 تعیین ارزش مشتری: از آنجا که قصد ما این است که مشتریان را بر اساس ارزش آنها برای شرکت یا فروشگاه دسته بندی کنیم، باید بتوانیم که معیاری برای ارزیابی و مشخص کردن ارزش آنها تعیین کنیم.برای هر شرکت تجاری که به فروش کالا می پردازد میزان فروش بسیار حائز اهمیت می باشد.از این رو مشتریانی که میزان خرید آنها بالاتر می باشد برای آنها با ارزش تر و جذاب تر می باشند.همچنین میزان وفاداری مشتری به شرکت یا فروشگاه برای صاحبان شرکت نکته مهم و قابل توجهی می باشد.بدیهی است مشتریانی که وفاداری آنها به شرکت بیشتر می باشد، دارای ارزش بیشتری نزد مدیران شرکت یا صاحبان فروشگاه هستند.تعداد خریدهای مشتری و درعین حال در دسترس بودن آن می تواند معیار مناسبی برای تعیین و مقداردهی میزان وفاداری مشتری باشد.یکی از اهداف شرکت های تجاری نگه داشتن و حفظ مشتریان فعلی می باشد.از این رو نیز در دسترس بودن مشتری برای آنها دارای اهمیت می باشد.یکی از معیارهایی که در دسترس بودن مشتری را مشخص می کند تاریخ آخرین خرید مشتری می باشد. تمام معیارهای بالا می تواند برای تعیین ارزش مشتریان یک سایت خرده فروشی اینترنتی حائز اهمیت باشد.برای اینکه بتوانیم تمام این معیارها را در ارزشیابی مشتریان بکار ببریم از روش تاخر، تناوب و مالی استفاده کردیم.این روش این امکان را بوجود می آورد که معیارهای تاخر که در دسترس بودن مشتری را نشان می دهد و تناوب که تعداد خریدهای مشتری را مشخص می کند و همچنین معیار مالی که مقدار پول خرج شده از طرف مشتری را نشان می دهد، بصورت یکجا مورد سنجش و ارزیابی قرار گیرند. برای ارزشیابی مشتریان توسط این روش هر سه معیار را برای مشتریان بررسی می کنیم و یک امتیاز کلی به آنها اختصاص می دهیم.برای تعیین معیار تاخر بازه زمانی که مشتریان مورد مطالعه ما قرار گرفته اند را به 5 بازه زمانی تقسیم می کنیم و از دورترین بازه زمانی تا نزدیکترین بازه زمانی عدد 1، 2، 3، 4 و 5 را به ترتیب به آنها اختصاص می دهیم.بنابراین اگر زمان آخرین خرید مشتری در هر یک از این بازه های زمانی باشد، نمره اختصاص یافته به آن بازه ارزش مشتری برای این معیار می باشد.بدیهی است که مشتری با نمره بیشتر ارزش بیشتری برای شرکت یا فروشگاه خواهد داشت. بازه زمانی کلی ما در این تحقیق از تاریخ 27/09/1390 تا تاریخ 26/11/1390 بود که آن را به 5 بازه تقسیم کرده ایم که همراه با نمره و ارزش آنها در جدول (3-2) آورده ایم. جدول3-2 : ارزش گذاری معیار Recency شماره بازهتاریخ ابتدای بازهتاریخ انتهای بازهارزش بازه127/09/139008/10/13901209/10/139020/10/13902321/10/139002/11/13903403/11/139014/11/13904515/11/139026/11/13905 برای تعیین معیار تناوب،کمترین و بیشترین تعداد خرید توسط مشتریان را مشخص کرده و این دو عدد را بازه کلی در نظر می گیریم و این بازه را به پنج بازه تقسیم می کنیم.بعد از آماده سازی داده ها و حذف رکوردهای زائد، کمترین تعداد خرید یک مشتری 3 و بیشترین تعداد خرید یک مشتری 12 می باشد.بنابر این به تعداد خرید 3 و 4 عدد خرید، نمره 1 و به 5 و 6 عدد خرید، نمره 2 و به 7 و 8 عدد خرید نمره 3 و به 9 و 10 عدد خرید نمره 4 و در نهایت به 11 و 12 عدد خرید نمره 5 را اختصاص می دهیم. برای تعیین معیار مالی نیز به این صورت عمل کردیم که کمترین و بیشترین میزان خرید را به عنوان بازه کلی در نظر گرفتیم و آن را به 5 بازه تقسیم کردیم.کمترین مقدار خرید 7000 تومان و بیشترین مقدار خرید نیز 75000 تومان می باشد.5 بازه مساوی بین این دو عدد در نظر گرفته شد که این بازه ها و نمره ای که برای آنها تعیین شده است در جدول ( 3-3) نشان داده شده است. جدول 3-3 : ارزش گذاری معیار Monetary شماره بازهاندازه بازهارزش بازه1از 7000 تومان تا 20000 تومان12از 21000 تومان تا 34000 تومان23از 35000 تومان تا 47000 تومان34از 48000 تومان تا 61000 تومان45از 62000 تومان تا 75000 تومان5 پس از مشخص شدن نحوه ارزش گذاری مشتریان بر اساس سه معیار تاخر، تناوب و مالی هریک از مشتریان را ارزش دهی می کنیم، به این صورت که به هر مشتری طبق قوانینی که برای ارزش دهی قرار دادیم سه عدد از 1 تا 5 اختصاص داده می شود که اولین عدد مربوط به معیار تاخر، دومین عدد مربوط به معیار تناوب و آخرین عدد مربوط به معیار مالی می باشد.این ارزش دهی برای تعدادی از مشتریان در جدول ( 3-4) آمده است و ارزش دهی کل مشتریان در فصل چهارم پایان نامه آمده است. جدول 3-4 : مثال نحوه تخصیص RFM شماره مشتریتاریخ آخرین خریدتعداد خریدمقدار خریدارزش RFM129/10/13908330002،3،3217/11/13908310005،3،210116/10/13904250002،1،2 3-4 استفاده از تکنیک های داده کاوی: برای دسته بندی مشتریان با توجه به ارزش های اختصاص داده شده به آنها از روش تاخر، تناوب و مالی، احتیاج داریم تا مشتریانی که ارزش های آنها مشابه و یا نزدیک بهم می باشد را در یک دسته قرار دهیم.یکی از ساده ترین و در دسترس ترین روش ها، خوشه بندی توسط الگوریتم K-Means است که با توجه به مراکزی که برای هر خوشه در نظر می گیرد، نمونه ها را بر طبق فاصله اقلیدسی آنها از هر یک از این مراکز به یکی از این خوشه ها اختصاص می دهد.از آنجایی که این الگوریتم معیار اندازه گیری فاصله اقلیدسی را برای نسبت دادن نمونه ها به نزدیکترین خوشه بکار می گیرد، ما هر یک از سه معیار تاخر، تناوب و مالی را یک بعد از فض در نظر می گیریم و ارزش های معیارهای هر یک از مشتریان را نشان دهنده مختصات آنها در فضا در نظر می گیریم.به این ترتیب با استفاده از الگوریتم خوشه بندی K-Means به دسته بندی مشتریان بر اساس ارزش آنها می پردازیم. قصد ما این است که مشتریان را بر اساس ارزش آنها که از رفتار خرید پیشینشان بدست آمده است، به 3 دسته مشتریان برتر، مشتریان میانه و مشتریان کم بهره دسته بندی کنیم بطوریکه آن دسته از مشتریانی که ارزش بیشتری برای شرکت دارند در دسته مشتریان برتر و آن دسته که پایین ترین ارزش را برای شرکت دارند در دسته مشتریان کم بهره و آن دسته که ارزش پایین تری از مشتریان برتر و ارزش بالاتری از مشتریان کم بهره دارند در دسته مشتریان میانه قرار گیرند. از آنجا که فضای مسئله ما یک فضای سه بعدی می باشد که اندازه هر بعد آن از عدد 1 تا عدد 5 می باشد، برای اینکه بتوانیم 3 مرکز خوشه داشته باشیم که فضا را به شکل مساوی تقسیم کنند و فاصله های یکسان از هم داشته باشند، ابتدا فضا را به 3 قسمت مساوی تقسیم کردیم و نقطه وسط هر قسمت را به عنوان مرکز انتخاب کردیم.بنابر این مختصات مرکز خوشه کم بهره (1.6،1.6،1.6 ) و مرکز خوشه میانه ( 3،3،3 ) و مرکز خوشه برتر ( 4.3،4.3،4.3 ) شد. پس از انجام خوشه بندی با استفاده از الگوریتم K-Means هر یک از مشتریان تنها و تنها به یک خوشه تعلق پیدا می کنند.با توجه به مشکلاتی که این الگوریتم دارد و پیش تر ذکر شدند، نیاز به تکمیل و اصلاح عیوب و نقوص بود.در نتیجه بر آن شدیم تا الگوریتم K-Harmonic Means که اصلاحی از الگوریتم K-Means می باشد را بصورت موازی با K-means بکار ببریم.با استفاده از این الگوریتم درجه تعلق هر مشتری را نسبت به هر کدام از این خوشه ها بدست می آوریم.بدین ترتیب علاوه بر تعلق مطلق هر مشتری به یک خوشه که از الگوریتم K-Means منتج می شود، درجه تعلق هر مشتری نسبت به هر خوشه را نیز در اختیار داریم که بعد از مرحله استخراج قوانین از آن ها استفاده می کنیم. بنابر این برای هر مشتری خوشه ای که توسط الگوریتم K-Means به آن اختصاص داده شده است به عنوان خوشه اصلی و خوشه ای که با توجه به الگوریتم K-Harmonic Means دومین درجه تعلق بزرگتر را نسبت به آن دارد، به عنوان خوشه دوم در نظر گرفته می شوند.اما با توجه به اینکه بیشترین درصدی که برای خوشه دوم یک مشتری می توان متصور شد کمتر از 50% می باشد، ما برای تحقیق خود درصدی بیش از نصف این 50% را برای معتبر ساختن خوشه دوم هر مشتری در نظر گرفتیم.بدین ترتیب برای هر مشتری اگر درجه تعلق آن به خوشه دوم بیشتر از 25% باشد معتبر شمرده می شود و می توان از قوانین مربوط به این خوشه برای مشتری استفاده کرد. هر دو الگوریتم K-Means و K-Harmonic Means را در محیط متلب ( MATLAB 7.12 )پیاده سازی کردم.کدهای مربوط به این دو پیاده سازی در زیر آمده است : کد خوشه بندی توسط K-harmonic means : x = [3.0 3.0 2.0;5.0 3.0 2.0;5.0 3.0 2.0;5.0 3.0 3.0;5.0 3.0 2.0;5.0 3.0 2.0;5.0 4.0 3.0;5.0 3.0 3.0;5.0 3.0 2.0;4.0 3.0 4.0;5.0 3.0 3.0;5.0 3.0 2.0;4.0 3.0 4.0;4.0 3.0 3.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 3.0 4.0;5.0 3.0 2.0;5.0 4.0 3.0;5.0 3.0 2.0;5.0 4.0 2.0;5.0 4.0 2.0;5.0 3.0 2.0;5.0 3.0 2.0;5.0 3.0 2.0;4.0 3.0 4.0;4.0 3.0 2.0;3.0 3.0 2.0;4.0 3.0 3.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 4.0 4.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 3.0 3.0;4.0 3.0 2.0;5.0 5.0 5.0;5.0 4.0 5.0;5.0 5.0 4.0;5.0 2.0 3.0;5.0 2.0 1.0;4.0 2.0 2.0;4.0 2.0 1.0;4.0 2.0 3.0;4.0 2.0 1.0;2.0 2.0 2.0;5.0 2.0 1.0;4.0 2.0 2.0;5.0 2.0 1.0;4.0 2.0 1.0;4.0 2.0 3.0;3.0 2.0 1.0;5.0 2.0 2.0;4.0 2.0 2.0;5.0 2.0 2.0;3.0 2.0 2.0;3.0 2.0 1.0;4.0 2.0 1.0;2.0 2.0 2.0;5.0 2.0 1.0;3.0 2.0 2.0;5.0 2.0 3.0;4.0 2.0 3.0;5.0 2.0 2.0;3.0 2.0 2.0;4.0 2.0 3.0;5.0 2.0 2.0;5.0 2.0 2.0;5.0 2.0 2.0;5.0 2.0 3.0;5.0 2.0 2.0;3.0 2.0 2.0;1.0 2.0 2.0;2.0 2.0 2.0;4.0 2.0 2.0;5.0 2.0 2.0;4.0 2.0 2.0;3.0 2.0 2.0;3.0 2.0 2.0;5.0 2.0 3.0;4.0 1.0 1.0;4.0 1.0 1.0;4.0 1.0 1.0;3.0 1.0 1.0;5.0 1.0 1.0;4.0 1.0 1.0;5.0 1.0 1.0;4.0 1.0 1.0;2.0 1.0 1.0;4.0 1.0 1.0;2.0 1.0 1.0;3.0 1.0 1.0;3.0 1.0 1.0;4.0 1.0 1.0;5.0 1.0 2.0;4.0 1.0 1.0;4.0 1.0 1.0;4.0 1.0 3.0;3.0 1.0 1.0;2.0 1.0 2.0]; c = [1.7 1.7 1.7;3.0 3.0 3.0;4.3 4.3 4.3]; B = 0; while B < 20 t = 0; cluster = [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]; q = [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]; f = [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]; s = [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]; o1 = [0 0 0]; o2 = [0 0 0]; o3 = [0 0 0]; l = [0 0 0]; for i = 1:101 for j = 1:3 D1(i,j) = ( x(i,1) - c(j,1) ); D2(i,j) = ( x(i,2) - c(j,2) ); D3(i,j) = ( x(i,3) - c(j,3) ); end end for i = 1:101 for j = 1:3 fprintf('Dis %d %d is: (%f,%f,%f)\n',i,j,D1(i,j),D2(i,j),D3(i,j)); end end for i = 1:101 for j = 1:3 dist(i,j)= sqrt((D1(i,j) ^ 2) + (D2(i,j) ^ 2) + (D3(i,j) ^ 2)); end end for i = 1:101 for j = 1:3 fprintf('Dist %d %d is: %f\n',i,j,dist(i,j)); end end for i = 1:101 for j = 1:3 t = t + ( 1 / ( dist(i,j) ^ 2 )); end end KHM = 2 / t; fprintf('KHM is:%f\n',KHM); for i = 1:101 for j = 1:3 q(i) = q(i) + ( dist(i,j) ^ (-4) ); end end for j = 1:3 for i = 1:101 m(j,i) = ( dist(i,j) ^ (-4) ) / q(i); end end for i = 1:101 for j = 1:3 f(i) = f(i) + ( dist(i,j) ^ (-4) ); s(i) = s(i) + ( dist(i,j) ^ (-2) ); end end for i = 1:101 r(i) = s(i) ^ 2; w(i) = f(i) / r(i); end for i = 1:101 fprintf('the weight of %d is: %f\n',i,w(i)); end for j = 1:3 for i = 1:101 o1(j) = o1(j) + ( m(j,i) * w(i) * x(i,1) ); o2(j) = o2(j) + ( m(j,i) * w(i) * x(i,2) ); o3(j) = o3(j) + ( m(j,i) * w(i) * x(i,3) ); l(j) = l(j) + ( m(j,i) * w(i) ); end end for j = 1:3 c(j,1) = o1(j) / l(j); c(j,2) = o2(j) / l(j); c(j,3) = o3(j) / l(j); end for j = 1:3 fprintf('c %d = (%f,%f,%f)\n',j,c(j,1),c(j,2),c(j,3)); end B = B + 1; end for i = 1:101 if (m(1,i) > m(2,i)&& m(1,i) > m(3,i)) cluster(i) = 1; else if (m(2,i) > m(3,i)) cluster(i) = 2; else cluster(i) = 3; end end end for i = 1:101 fprintf('membership of item %d for cluster 1,2,3 is: %f,%f,%f \n',i,m(1,i),m(2,i),m(3,i)); end for i = 1:101 fprintf('first cluster of the item %d is:%d \n',i,cluster(i)); end کد خوشه بندی توسط K-means : x = [3.0 3.0 2.0;5.0 3.0 2.0;5.0 3.0 2.0;5.0 3.0 3.0;5.0 3.0 2.0;5.0 3.0 2.0;5.0 4.0 3.0;5.0 3.0 3.0;5.0 3.0 2.0;4.0 3.0 4.0;5.0 3.0 3.0;5.0 3.0 2.0;4.0 3.0 4.0;4.0 3.0 3.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 3.0 4.0;5.0 3.0 2.0;5.0 4.0 3.0;5.0 3.0 2.0;5.0 4.0 2.0;5.0 4.0 2.0;5.0 3.0 2.0;5.0 3.0 2.0;5.0 3.0 2.0;4.0 3.0 4.0;4.0 3.0 2.0;3.0 3.0 2.0;4.0 3.0 3.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 4.0 4.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 3.0 3.0;4.0 3.0 2.0;5.0 5.0 5.0;5.0 4.0 5.0;5.0 5.0 4.0;5.0 2.0 3.0;5.0 2.0 1.0;4.0 2.0 2.0;4.0 2.0 1.0;4.0 2.0 3.0;4.0 2.0 1.0;2.0 2.0 2.0;5.0 2.0 1.0;4.0 2.0 2.0;5.0 2.0 1.0;4.0 2.0 1.0;4.0 2.0 3.0;3.0 2.0 1.0;5.0 2.0 2.0;4.0 2.0 2.0;5.0 2.0 2.0;3.0 2.0 2.0;3.0 2.0 1.0;4.0 2.0 1.0;2.0 2.0 2.0;5.0 2.0 1.0;3.0 2.0 2.0;5.0 2.0 3.0;4.0 2.0 3.0;5.0 2.0 2.0;3.0 2.0 2.0;4.0 2.0 3.0;5.0 2.0 2.0;5.0 2.0 2.0;5.0 2.0 2.0;5.0 2.0 3.0;5.0 2.0 2.0;3.0 2.0 2.0;1.0 2.0 2.0;2.0 2.0 2.0;4.0 2.0 2.0;5.0 2.0 2.0;4.0 2.0 2.0;3.0 2.0 2.0;3.0 2.0 2.0;5.0 2.0 3.0;4.0 1.0 1.0;4.0 1.0 1.0;4.0 1.0 1.0;3.0 1.0 1.0;5.0 1.0 1.0;4.0 1.0 1.0;5.0 1.0 1.0;4.0 1.0 1.0;2.0 1.0 1.0;4.0 1.0 1.0;2.0 1.0 1.0;3.0 1.0 1.0;3.0 1.0 1.0;4.0 1.0 1.0;5.0 1.0 2.0;4.0 1.0 1.0;4.0 1.0 1.0;4.0 1.0 3.0;3.0 1.0 1.0;2.0 1.0 2.0]; c = [1.7 1.7 1.7;3.0 3.0 3.0;4.3 4.3 4.3]; B = 0; while B < 20 t = 0; g = 0; k = 0; p = 0; s = 0; a = 0; r = 0; n = 0; l = 0; q = 0; f = 0; o = 0; m = [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]; for i = 1:101 for j = 1:3 D1(i,j) = ( x(i,1) - c(j,1) ); D2(i,j) = ( x(i,2) - c(j,2) ); D3(i,j) = ( x(i,3) - c(j,3) ); end end for i = 1:101 for j = 1:3 fprintf('Dis %d %d is: (%f,%f,%f)\n',i,j,D1(i,j),D2(i,j),D3(i,j)); end end for i = 1:101 for j = 1:3 dist(i,j)= sqrt((D1(i,j) ^ 2) + (D2(i,j) ^ 2) + (D3(i,j) ^ 2)); end end for i = 1:101 if (dist(i,1) < dist(i,2) && dist(i,1) < dist(i,3)) m(i) = 1; else if (dist(i,2) < dist(i,3)) m(i) = 2; else m(i) = 3; end end end for i = 1:101 if (m(i) == 1) t = x(i,1) + t; r = x(i,2) + r; q = x(i,3) + q; p = p +1; else if (m(i) == 2) s = x(i,1) + s; n = x(i,2) + n; f = x(i,3) + f; k = k +1; else if (m(i) == 3) a = x(i,1) + a; l = x(i,2) + l; o = x(i,3) + o; g = g +1; end end end end c(1,1) = t/p; c(1,2) = r/p; c(1,3) = q/p; c(2,1) = s/k; c(2,2) = n/k; c(2,3) = f/k; c(3,1) = a/g; c(3,2) = l/g; c(3,3) = o/g; B = B + 1; end for i=1:101 fprintf('item %d is for cluster: %d\n',i,m(i)); end fprintf('1st cluster center is: %f,%f,%f\n',c(1,1),c(1,2),c(1,3)); fprintf('2nd cluster center is: %f,%f,%f\n',c(2,1),c(2,2),c(2,3)); fprintf('3th cluster center is: %f,%f,%f\n',c(3,1),c(3,2),c(3,3)); در پیاده سازی این دو الگوریتم تعداد تکرار مراحل تکراری الگوریتم را 20 بار تعیین کردم، زیرا پس از این تعداد تکرار دیگر مراکز خوشه ها تغییر چندانی پیدا نمی کردند. همچنین در الگوریتم K-Harmonic Means مقدار پارامتر P را 2 در نظر گرفتم. پس از اینکه مشتریان را توسط هر دوی این الگوریتم ها خوشه بندی کردیم، به علت سخت بخشبندی1 بودن الگوریتم K-Means، قوانین استقرایی مربوط به هر خوشه، که از رفتار خرید پیشین مشتریان هر خوشه بدست می آید و رفتار خرید آتی مشتریان همان خوشه را پیش بینی می کند را از خوشه های منتج شده از K-Means بدست می آوریم.برای استخراج چنین قوانینی الگوریتم استقرایی که ساده ترین و معروفترین الگوریتم در این زمینه است را بکار می بریم. برای استفاده از این الگوریتم بر روی خوشه های مشتریان باید دو مفهوم را مشخص و مقداردهی کرد.همانطور که در فصل قبل گفته شدقوانین استنتاجی که از خوشه ها استخراج می شوند بصورت اگر، آنگاه می باشند.مثلا اگر کالای A خریداری شود آنگاه به احتمال زیاد کالای B نیز خریداری می شود. مفهوم حداقل درجه پشتیبانی طبق تعریفی که در فصل قبل انجام شد، برای قانون بالا، درصدی به معنای آن است که در رکوردهای پایگاه داده نسبت رکوردهایی که دارای A و B هستند به کل رکوردها، اگر از این درصد کمتر شود قانون معتبر نخواهد بود. همچنین مفهوم حداقل درجه اطمینان طبق تعریفی که در فصل قبل انجام شد، برای قانون بالا، درصدی به معنای آن است که در رکوردهای پایگاه داده نسبت رکوردهایی که دارای A و B هستند به رکوردهایی که دارای A هستند، اگر از این درصد کمتر شود قانون معتبر نخواهد بود. با توجه به تعداد کالاها و همچنین تکرار و بررسی درصدهای گوناگون و تعداد قوانینی که بدست می آمد به این نتیجه رسیدم که بهترین درصد برای کمینه پشتیبانی 10% و بهترین درصد برای کمینه اطمینان 60% می باشد.در نتیجه با استفاده از نرم افزار وکا1 3.7 که یکی از ابزارهای داده کاوی می باشد الگوریتم استقرایی با کمینه پشتیبانی 10% و کمینه اطمینان 60% برای هر یک از خوشه ها بکار برده شد. 3-5 رهیافتی برای شخصی سازی تبلیغات: بعد از اینکه قوانین مربوط به رفتار خرید مشتریان در هر خوشه را استخراج کردیم باید رهیافتی را برای استفاده از این قوانین تعیین کنیم.ما این راه حل را در نظر گرفتیم که قوانین استخراج شده برای هر خوشه، علاوه بر اینکه برای هر مشتری متعلق به آن خوشه مورد استفاده قرار می گیرد، برای مشتریانی که این خوشه دومین خوشه آنها می باشد و درجه تعلقی بیش از 25% را نسبت به آن دارند نیز مورد استفاده قرار گیرد. بدین صورت طبق قوانینی که بدست آوردیم برای هر مشتری به نسبت اولین کالایی که خرید می کند، تبلیغی مناسب به او ارائه می شود.قالب کاری سیستمی که برای این رهیافت در نظر گرفتیم همانطور که در شکل ( 3-2) مشاهده می شود بدین ترتیب است: احراز هویت مشتری مشخص شدن خوشه اول و خوشه دوم مشتری خرید کالا ارائه تبلیغ مربوط به بیشترین کالای خریداری شده در خوشه اولآیا قانونی مربوط به این کالا در خوشه دوم وجود دارد؟آیا قانونی مربوط به این کالا در خوشه اول وجود دارد؟ خیر خیر ارائه تبلیغ مربوط به خوشه اولارائه تبلیغ مربوط به خوشه دوم بلی بلی شکل3-2: فلوچارت سیستم ارائه تبلیغ در سایت ابتدا به احراز هویت مشتری می پردازیم و هر مشتری با نام کاربری و رمز عبور یکتایی که دارد وارد سایت شده و شناسایی می شود.همچنین با استفاده از پایگاه داده سایت و جدولی به نام مشتریان در آن خوشه اصلی و دومین خوشه ای که مشتری به آنها تعلق دارد مشخص می شود.پس از اولین خریدی که مشتری در سایت انجام می دهد، با توجه به کالایی که خریداری کرده است، جستجویی در سیستم صورت می گیرد بدین ترتیب که آیا قانونی در خوشه اصلی برای این کالا وجود دارد یا خیر.اگر قانونی وجود داشت، تبلیغ کالای مربوط به آن قانون به مشتری ارائه می گردد اما اگر قانونی وجود نداشته باشد آنگاه جستجو می شود که آیا قانون استخراج شده ای از خوشه دوم مشتری برای این کالا وجود دارد یا خیر.اگر قانونی وجود داشت، تبلیغ کالای مربوط به آن قانون ارائه می گردد اما اگر قانونی وجود نداشت تبلیغ کالایی به مشتری ارائه می گردد که بیشترین تعداد فروش را در بین اعضای خوشه اصلی مشتری دارد. 3-6 روش ارزیابی: برای اینکه بتوانیم نشان دهیم که این مدل جدید تا چه اندازه مفید بوده است و برای اثبات اینکه این مدل می تواند جایگزین روش های قبلی شود باید به ارزیابی این مدل با روشی که قبل از آن بکار برده می شده است پرداخت.برای این کار تعداد دفعاتی که تبلیغ یک کالا به مشتری ارائه می شود و همچنین تعداد دفعاتی که کالای پیشنهاد شده مورد خرید مشتری قرار می گیرد را ثبت می کنیم. تعداد دفعات خرید کالای پیشنهاد شده نسبت به تعداد دفعات پیشنهاد شدن این کالا درصد موفقیت تبلیغ این کالا را نشان می دهد و در حالت کلی میانگین درصد موفقیت تبلیغ تمام کالاها نشان دهنده موفقیت کلی این مدل در ارائه تبلیغات بر حسب علایق مشتری می باشد.ضمنا برای اینکه نشان دهیم خوشه بندی K-Harmonic Means و بکارگیری قوانین خوشه دوم تا چه اندازه مفید واقع شده است تعداد دفعات پیشنهاد شدن کالا بر طبق قوانین مربوط به خوشه دوم هر مشتری و همچنین تعداد دفعات مورد خرید قرار گرفتن این کالاهای پیشنهاد شده از قوانین خوشه دوم را حساب می کنیم و بعد از آن می توان نسبت موفقیت این قوانین را بدست آورد و با نسبت موفقیت کل این مدل مقایسه کرد.برای ثبت تعداد پیشنهادهای ارائه شده و تعداد پیشنهادهای خریداری شده، در برنامه نویسی سایت این امکان را بوجود آوردیم که بعد از هر پیشنهاد و بعد از هر خریداری پیشنهاد، مقدار فیلد مربوط به آنها در جدول خرید پایگاه داده 1 عدد اضافه شود. منابع: 1. Ling, R., & Yen, D. C. “Customer relationship management: An analysis framework and implementation strategies”. Journal of Computer Information Systems, Volume 41, (2001). Pages 82–97. 2. Zablah, A.R., Bellenger, D.N. and Johnston, W.J. “An evaluation of divergent perspectives on customer relationship management: Towards a common understanding of an emerging phenomenon”, Industrial Marketing Management Volume 33, Issue 6, (2004). Pages 475-489 3. WIKSTRÖM, C.E. “Organizational Change And Customer Relationship Management Success” , available at http://www.cs.uta.fi/is/julkaisut/2003/2003_wikstrom_1.pdf, (2004) –Pages 1-11 4. Mohammad Sourizaei, Dr.Ahmad Reza Keikhayfarzaneh, Dr.Javad Khalatbari, Mohammad Mojtaba Keikhayfarzaneh, “Customer Relationship Management (CRM) and Its Risk Factors”, International Journal of Scientific & Engineering Research Volume 2, Issue 8, ISSN 2229-5518. August 2011 5. Turban, E, Mclean, E. And Wetherber, J, “Information Technology for Management Making Connections for Strategic Advantage”, 2nd Ed. New York; Wiley, 2002. 6. Burnett. Handbook of Key Customer Relationship Manage-ment: “The Definitive Guide to Winning, Managing and Developing Key Account Business”, Prentice Hall: New Jersy.2001. 7. Hamp Jf & P.Swatman. “Customer Relationship Management” , Case Studies of Swedish, Luella university of Technologies. 2002. 8. Feinburg j, & N.C.Romano. “ Electronic Customer Relationship Management- Revising the General Principles of Usability and Resistance- an Integrative Implementation Framework”, Business Process Management Journal , Vol . 9, No.5. 2003. 9. البداوي، امیر وعنایت تبار، محمد ، "مدیریت ارتباط با مشتري در محیط الکترونیکی"، چهارمین کنفرانس بین المللی مدیریت ،تهران ، آذرماه 1385 10. ThuyUyen H. Nguyen, “Strategies for successful CRM implementation”, Information Management & Computer Security, Vol. 15 No. 2, (2007), Pages 102-115 11. Hicks, D. “Customer focus meets business agility: the business case for SOA”, CRM Project, available at: www.crmproject.com, Vol. 6 , (2006). 12. Massy, P, A, Montoya-Weiss, M.M, Holcom, K., “Re-engineering the customer relationship” , Leveraging Knowledge assets at IBM, Decision Support System, vol.32, 2003, Pages 155-170. 13. Peppard, J. “Customer relationship management (CRM) in financial services”, EuropeanManagement Journal, Vol.18 No. 3. (2000),Pages 312-327 14. Bauer, H.H., Grether, M. and Leach, M. “Building customer relations over the internet”, Industrial Marketing Management, Vol. 31, (2002), pp. 155-163. 15. Frawley, A, “Evolving to eCRM: how to optimize interactive relationships between you and your customers”, white paper, Xchange Inc.(2000), available at: www.ctiforum.com/ technology/CRM/wp03 /ecrmwhitepaper.pdf. 16. Przemysław Kazienko, Michał Adamski, “AdROSA—Adaptive personalization of web advertising”, Information Sciences 177, (2007), Pages 2269–2295 17. احمد روستا، سيد ابوالفضل ابوالفضلي، حسن قرباني،" بررسي نقش تعديل كننده عدم اعتماد به اجتناب از تبليغات اينترنتي"، نشريه مديريت فناوري اطلاعات، دوره 1، شماره 2، بهار و تابستان 1388 ، از صفحه 51 تا 66 18.محمدرضا داوری، فریبرز قهرمانی، بهروز مینایی بیدگلی، " استفاده از داده کاوی برای ارائه مدل رفتاری آژانسهای فروش بلیط در زنجیره تامین شرکت های هواپیمایی " ، کنفرانس بین المللی داده کاوی، دانشگاه امیرکبیر تهران، سال 2008 19.Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers,March 2006 20.Barry,M; Linoff,G. “Data Mining Techniques for Marketing”, Sales and Customer Support.New York:John Wiley & sons,1997 21. هیوا صمدیان، حمید عابد، ادریس بابائی، " بررسی کاربرد و تاثیر استفاده از داده کاوی در حوزه مسکن در ایران " ، کنفرانس بین المللی داده کاوی، دانشگاه امیرکبیر تهران، سال 2008 22. Nikolaos Mastrogiannis, Basilis Boutsinas, Ioannis Giannikos. “ A method for improving the accuracy of data mining classification algorithms”, Computers & Operations Research, Volume 36, Issue 10, October 2009, Pages 2829-2839 23. Shu-hsien Liao, Pei-hui Chu, Yin-ju Chen, Chia-Chen Chang, “mining customer knowledge for exploring online group buying behavior”, Expert Systems with Applications, Volume 39, Issue 3, 15 February 2012, Pages 3708-3716 24. ايزدپرست سيد محمود، وحدت داود، "داده کاوی و کاربرد آن در کتابخانه ها و مؤسسات آموزشی" ، ماهنامه ارتباط علمي ، مرداد 1388 25. شهرابی، جمال." داده کاوی " جلد اول، جهاد دانشگاهی واحد صنعتی امیرکبیر 1386. 26. Rui Xu, Donald Wunsch II, “Survey of Clustering Algorithms”, IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 16, NO. 3, MAY 2005 27. André L. Vizine , Ro N. De Castro , Eduardo R. Hruschka , Ricardo R. Gudwin. “Towards Improving Clustering Ants: An Adaptive Ant Clustering Algorithm”. Informatica 29, 2005,Pages 143–153 28. Fengqin Yang, Tieli Sun, Changhai Zhang, “An efficient hybrid data clustering method based on K-harmonic means and Particle Swarm Optimization”, Expert Systems with Applications 36 (2009),Pages 9847–9852 29. مسعود یقینی، رقیه سیدی، "نسیم گریلی نیا، طبقه بندي ايستگاه هاي مسافري راه آهن جمهوري اسلامي ايران با استفاده از تكنيك خوشه بندي"، کنفرانس بین المللی داده کاوی، دانشگاه امیرکبیر تهران، سال 2008 30. مجتبي كوپايي، بهروز مينايي بيدگلي، "روشي براي رتبه بندي تغييرات در الگوي رفتاري مشتريان فروشگاه هاي زنجيره اي"، کنفرانس بین المللی داده کاوی، دانشگاه امیرکبیر تهران، سال 2008 31. Zhang, B., Hsu, M., and Dayal, U. “K-harmonic means – a data clustering algorithm”, Technical Report HPL- Hewlett-Packard Laboratories, 1999-124. 32. Hua Jiang, Shenghe Yi, Jing Li, Fengqin Yang, Xin Hu, “Ant clustering algorithm with K-harmonic means clustering”, Expert Systems with Applications 37 (2010), Pages 8679–8684 33. Shehroz S. Khan, Amir Ahmad, “Cluster center initialization algorithm for K-means clustering”, Pattern Recognition Letters 25, (2004),Pages 1293–1302 34. Mehran Mansouri, “The Effect of Minimum Support Parameter on Association Rule Discovery Algorithms Performance”, IDMC2008, Amir Kabir University 35. Agrawal, R. and R. Srikant. “Fast Algorithms for Mining Association Rules in Large Databases”, Proceedings of the 20th International Conference on Very Large Data Bases table of contents. (1994) .Pages 487-499 36. رحمان علیمحمد زاده، داده کاوی از پایگاه های داده XML، پایان نامه کارشناسی ارشد در رشته مهندسی فناوری اطلاعات، دانشگاه تهران، شهریور 1385 37. Babak Sohrabi, Amir Khanlari, “Customer Lifetime Value (CLV) Measurement Based on RFM Model” , Iranian Accounting & Auditing Review, Spring 2007,Vol. 14 No. 47, Pages 7- 20 38. Chang H-C, Tsai H-P., “Group RFM Analysis as a Novel Framework to Discover Better Customer Consumption Behavior”, Expert Systems with Applications 38 (2011) 39. Ching-Hsue Cheng, You-Shyang Chen, “Classifying the segmentation of customer value via RFM model and RS theory”, Expert Systems with Applications 36 (2009) 40. Wen-Yu Chiang, “To mine association rules of customer values via a data mining procedure with improved model: An empirical case study”, Expert Systems with Applications 38 (2011) 41. Morteza Namvar, Mohammad R. Gholamian, Sahand KhakAbi , “A Two Phase Clustering Method for Intelligent Customer Segmentation”, International Conference on Intelligent Systems, Modelling and Simulation,2010 42. Shuhsien Liao, “Mining customer knowledge for direct selling and marketing”, Expert Systems with Applications 38 (2011) 43. Seyed Mohammad Seyed Hosseini, Anahita Maleki, Mohammad Reza Gholamian, “Cluster analysis using datamining approach to develop CRM methodology”, Expert Systems with Applications 37 (2010) 44. Pramod Prasad et al. “Generating Customer Profiles for Retail Stores Using Clustering Techniques”, International Journal on Computer Science and Engineering, Vol. 3 No. 6 June 2011 45. Guozheng Zhang; , “Customer Segmentation Based on Survival Character”, Wireless Communications, Networking and Mobile Computing. WiCom,International Conference, 21-25 Sept. 2007 . Pages 3391-3396 46. VASILIS AGGELIS, DIMITRIS CHRISTODOULAKIS, “Customer Clustering using RFM analysis”, ICCOMP'05 Proceedings of the 9th WSEAS International Conference on Computers ,2005 47. Shu-Hsien Liao,Chia-Lin Hsieh, Sui-Ping Huang, “Mining product maps for new product development”, Expert Systems with Applications 34 (2008) 48. Changsheng Zhang, Jing Ruan, “A Modified Apriori Algorithm with Its Application in Instituting Cross-Selling Strategies of the Retail Industry”, International Conference on Electronic Commerce and Business Intelligence, 2009 49. Shu-Hsien Liao, Chih-Hao Wen. , “Mining Demand Chain Knowledge for New Product Development and Marketing”, Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on , vol.39, no.2, March 2009, Pages 223-227 50. Hwang, H., Jung, T., & Suh, E. “An LTV model and customer segmentation based on customer value: A case study on the wireless telecommunication industry”. Expert Systems with Applications, 26,(2004), Pages 181–188 51. Taeho Hong, Eunmi Kim, “Segmenting customers in online stores based on factors that affect the customer’s intention to purchase”, Expert Systems with Applications 39 (2012) 52. Shu-hsien Liao, Yin-Ju Chen, Min-yi Deng, “Mining customer knowledge for tourism new product development and customer relationship management”, Expert Systems with Applications 37 (2010),Pages 4212–4223 53. Yi-Hui Liang, “Integration of data mining technologies to analyze customer value for the automotive maintenance industry”, Expert Systems with Applications 37 (2010), Pages 7489–7496 54. Mahboubeh Khajvand, Kiyana Zolfaghar, Sarah Ashoori, Somayeh Alizadeh, “Estimating customer lifetime value based on RFM analysis of customer purchase behavior: case study”, Procedia Computer Science 3 (2011), Pages 57–63 55. Shu-Hsien Liao, Chyuan-Meei Chen, Chung-Hsin Wu, “Mining customer knowledge for product line and brand extension in retailing”, Expert Systems with Applications 34 (2008),Pages 1763–1776 56. Mohammad Ali Farajian, Shahriar Mohammadi, “Mining the Banking Customer Behavior Using Clustering and Association Rules Methods”, International Journal off Industrial Enginering & Production Research, Vol 21, No 4, December 2010 57. Waminee Niyagas, Anongnart Srivihok, Sukumal Kitisin, “Clustering e-Banking Customer using Data Mining and Marketing Segmentation”, ECTI TRANSACTIONS ON COMPUTER AND INFORMATION TECHNOLOGY VOL.2, NO.1 MAY 2006

فایل های دیگر این دسته

مجوزها،گواهینامه ها و بانکهای همکار

فروشگاه زرچوبه دارای نماد اعتماد الکترونیک از وزارت صنعت و همچنین دارای قرارداد پرداختهای اینترنتی با شرکتهای بزرگ به پرداخت ملت و زرین پال و آقای پرداخت میباشد که در زیـر میـتوانید مجـوزها را مشاهده کنید