داده‌هاي ناقص و گمشده154 اين تعداد به 3564 رکورد رسيده است. براي نمونه‌گيري از روش نمونه‌گيري تصادفي ساده استفاده شده است و براي تعيين حجم نمونه از فرمول کوکران (3-1) استفاده شده است. حجم نمونه بدست آمده با اين فرمول 347 مشتري مي‌باشد.
(3-1)

N = حجم جامعه
n = حجم نمونه
Z = مقدار متغير نرمال واحد استاندارد، که در سطح اطمينان 95 درصد برابر 1.96 مي باشد
P = مقدار نسبت صفت موجود در جامعه است اگر در اختيار نباشد مي توان آن را 5/0 درنظر گرفت. در اين حالت مقدار واريانس به حداکثر مقدار خود مي رسد.
d = مقدار اشتباه مجاز

3-4 شرح مدل
طبق بررسي ادبيات موضوع، از شاخص هاي مدل RFM يعني تاخر155، تناوب156، ارزش پولي157 براي بررسي رفتار مشتري استفاده مي‌شود. در اين پژوهش نيز براي سنجش ارزش رفتاري مشتريان از سه شاخص مذکور و همچنين از شبکه خود سازمانده براي بخش‌بندي در سه مدل طراحي شده استفاده مي‌شود. به دليل استفاده از شبکه خود سازمانده همه متغيرهاي اسمي و عددي به بازه صفر و يک منتقل مي‌شوند. براي تبديل متغيرهاي اسمي به متغيرهاي عددي از کدگذاري 1 از 1-N استفاده مي‌کنيم که اين کار باعث انتقال اين متغيرها به بازه صفر و يک مي‌شود. براي انتقال متغيرهاي عددي به بازه صفر و يک از فرمول 3-2 استفاده مي‌کنيم.
(3-2)

در اين تحقيق به ارائه يک متدولوژي جامع شامل سه مدل دو مرحله‌اي براي بخش‌بندي مشتريان بر اساس ارزش آنها مي‌پردازيم. در اين متدولوژي از دو پايگاه داده، شامل پروفايل شخصي مشتريان158 و داده‌هاي معاملاتي159 و استفاده مي‌نماييم که در شکل 3-1 نشان داده شده است.

شکل3-1 متدولوژي تحقيق

شکل‌هاي 3-2، 3-3 و 3-4 مدل‌هاي توسعه داده شده را در اين متدولوژي بيان مي‌کند.
در مدل اول از اين متدولوژي، ابتدا بخش‌بندي را بر اساس داده‌هاي جمعيت‌شناختي160 از پروفايل مشتريان با استفاده از شبکه عصبي خود سازمانده161 انجام مي‌دهيم، سپس به بخش‌بندي دوباره هر کدام از بخش‌هاي نتيجه گرفته شده از مرحله اول بر اساس داده‌هاي معاملاتي با استفاده از ابزارهاي داده‌کاوي RFM و K ميانگين مي‌پردازيم در اين مرحله K بهينه را از شاخص ديويس بولدين به دست مي‌آوريم. در نهايت بخش‌هاي بدست آمده را بر اساس ارزششان رتبه‌بندي مي‌کنيم.

شکل 3-2 اولين مدل توسعه داده شده جهت بخش بندي مشتريان بر اساس ارزش آنها

در مدل دوم از اين متدولوژي، ابتدا مشتريان را بر اساس داده‌هاي معاملاتي (RFM وزن‌دار) با استفاده از الگوريتم K ميانگين بخش‌بندي مي‌نماييم، در اين روش مقدار K بهينه از قبل توسط شاخص ديويس بولدين تعيين مي‌شود. سپس هر بخش به دست آمده از مرحله اول را بر اساس داده‌هاي جمعيت‌شناختي با استفاده از شبکه عصبي خود سازمانده دوباره بخش‌بندي مي‌نماييم و در نهايت بخش‌هاي بدست آمده را بر اساس ارزششان رتبه‌بندي مي‌کنيم.

شکل 3-3 دومين مدل توسعه داده شده جهت بخش بندي مشتريان بر اساس ارزش آنها

در مدل سوم از اين متدولوژي، ابتدا مشتريان را با استفاده از شبکه عصبي خود سازمانده، بر اساس متغيرهاي جمعيت‌شناختي و متغيرهاي تراکنشي (RFM وزن‌دار) بخش‌بندي نموده سپس از تعداد خوشه‌ي بدست آمده (k) و مراکز خوشه‌ها به عنوان ورودي روش K ميانگين براي بخش‌بندي دوباره مشتريان بر اساس متغيرهاي جمعيت‌شناختي و تراکنشي استفاده مي‌نماييم و در نهايت بخش‌هاي بدست آمده را بر اساس ارزششان رتبه‌بندي مي‌کنيم.

شکل 3-4 سومين مدل توسعه داده شده جهت بخش بندي مشتريان بر اساس ارزش آنها

3-5 ارزيابي اعتبار مدل
براي ارزيابي اعتبار مدل از شاخص ديويس بولدين و مجموع مربعات خطا162 استفاده شده است.
شاخص ديويس بولدين معياري براي سنجش کيفيت الگوريتم هاي خوشه‌بندي است که اولين بار توسط ديويس و بولدين در سال 1979 ارائه شد (سيد حسيني و همکاران، 2010). اين معيار از شباهت بين دو خوشه استفاده مي‌کند که بر اساس پراکندگي يک خوشه () و عدم شباهت بين دو خوشه () تعريف مي‌شود. شباهت بين دو خوشه را مي‌توان به صورتهاي مختلفي تعريف کرد ولي بايستي شرايط زير را دارا باشد.

اگر و هر دو برابر صفر باشند آنگاه نيز برابر صفر باشد.
اگر و آنگاه
اگر و آنگاه
معمولا شباهت بين دو خوشه به صورت زير تعريف مي‌شود:
(3-2)

که در آن و با روابط زير محاسبه مي‌شوند.
(3-3)

(3-4)

با توجه به مطالب بيان شده و تعريف شباهت بين دو خوشه شاخص ديويس بولدين به صورت زير تعريف مي‌شود.
(3-5)

که در آن به صورت زير محاسبه مي‌شود.
(3-6)

اين شاخص در واقع ميانگين شباهت بين هر خوشه با شبيه‌ترين خوشه به آن را محاسبه مي‌کند. مي‌توان دريافت که هرچه مقدار اين شاخص کمتر باشد، خوشه‌هاي بهتري توليد شده است (ميرزاييان، 1391).
شاخص مجموع مربعات خطا را نيز براي ارزيابي و مقايسه کيفيت سه مدل بخش‌بندي استفاده شده است. اين شاخص به صودت زير محاسبه مي‌شود (هوانگ و کچادي، 2013):
(3-7)

داريم:
: تعداد داده‌ها در خوشه‌ي
oij: jامين داده از خوشه‌ي
همانطور که ملاحظه مي‌شود اين معيار تنها شباهت درون خوشه‌اي را در نظر مي‌گيرد و هرچه اين مقدار کمتر باشد کيفيت خوشه‌بندي بهتر است.
در نهايت جامع‌ترين مدل را با الگوريتم معروف K ميانگين بنا بر دو معيار بيان شده مقايسه مي‌نماييم.

فصل 4:
تجزيه و تحليل داده‌ها
(پياده‌سازي مدل در مرکز اپل ايران)

فصل 4: تجزيه و تحليل داده‌ها (پياده‌سازي مدل در مرکز اپل ايران)
4-1 مقدمه
در اين فصل ابتدا به معرفي داده‌هاي مورد استفاده در مدل‌ها مي‌پردازيم. سپس روش‌هاي ابتکاري، تجزيه و تحليل داده‌‌ها و بخش‌بندي مشتريان بر اساس ارزش آنها در مدل‌ها بررسي مي‌گردد، همچنين مراحل و نتايج عددي حاصل از پياده‌سازي مدل در مرکز اپل ايران تشرح مي‌گردد.
4-2 درک و شناخت داده‌ها
داده‌هاي مورد استفاده در اين تحقيق مربوط به فروشگاه‌هاي زنجيره‌اي مرکز اپل ايران است که داراي شعب متعدد مي‌باشد. داده‌ها توصيف‌کننده‌ي تراکنش‌هاي انجام شده توسط مشتريان اين فروشگاه زنجيره‌اي از ماه ژانويه‌ تا دسامبر سال 2012 يعني 12 ماه مي‌باشند. به دليل محدوديت در پرسيدن داده‌هاي جمعيت‌شناختي مشتريان، در نهايت سه مشخصه از آنها مورد بررسي قرار گرفت. مشخصه‌هاي اسمي شامل جنسيت و تحصيلات، و مشخصه‌ي عددي شامل سن مي‌باشد. طيف سني 347 مشتري نمونه‌گيري شده، از 11 سال تا 70 سال مي‌باشد، که با فرمول 4-1 به بازه صفر و يک منتقل شده‌اند.
(4-1)

نتايج جدول و شکل 4-1 نشان مي‌دهدکه از 347 نفر گروه نمونه، 89 نفر (26 درصد) داراي تحصيلات ديپلم و زير ديپلم، 180 نفر (52 درصد) داراي تحصيلات ليسانس و فوق ديپلم، 61 نفر (17 درصد) داراي تحصيلات فوق ليسانس و 17 نفر (5 درصد) داراي تحصيلات دکتري هستند.

جدول 4-1 فراواني و درصد فراواني گروه نمونه بر حسب سطح تحصيلات

سطح تحصيلات
فراواني
درصد فراواني
ديپلم و زير ديپلم
89
26
ليسانس و فوق ديپلم
180
52
فوق ليسانس
61
17
دکترا
17
5
جمع کل
347
100

شکل 4-1 نمودار فراواني گروه نمونه بر حسب سطح تحصيلات

نتايج جدول و شکل 4-2 نشان مي‌دهد که از حجم 347 نفر گروه نمونه، 266 نفر (77 درصد) مرد و 81 نفر (23 درصد) زن هستند.
جدول 4-2 فراواني و درصد فراواني گروه نمونه بر حسب جنسيت
جنسيت
فراواني
درصد فراواني
مرد
266
77
زن
81
23
جمع کل
347
100

شکل 4-2 نمودار فراواني گروه نمونه بر حسب جنسيت

داده‌هاي تراکنشي مشتريان نيز شامل مشخصه‌هاي عددي تأخر، تناوب و ارزش پولي هر مشتري مي‌باشد. که البته چون اين پارامترها در مکان‌هاي تجاري مختلف وزن متفاوتي دارند به روش AHP و با نظر خبرگان مرکز اپل ايران، آنها را وزن‌دار کرده‌ايم.
4-3 آماده‌سازي داده‌ها
همانطور که در فصل قبل بيان شد، رکوردهايي که داده‌هاي غايب داشتند براي پاک‌سازي داده‌ها حذف شدند. داده‌هاي اين تحقيق شامل دو دسته داده‌هاي تراکنشي و داده‌هاي شخصي است. اين داده‌ها را نرماليزه (استاندارد) مي‌نماييم تا در يک طيف مشابه قرار گيرند.
براي نرماليزه کردن متغيرهاي F و M از فرمول 4-2 استفاده مي‌گردد:
(4-2)

براي متغير R از فرمول‌ 4-3 براي نرماليزه کردن استفاده مي‌گردد:
(4-3)

که در فرمول‌هاي ذکر شده داريم:
: بزرگترين مقدار
: کوچک‌ترين مقدار
با استفاده از فرمول‌هاي بالا نرم مقادير متغيرهاي R و Fو M محاسبه مي‌شوند. پس از نرمالايز کردن تناوب، تاخر و ارزش پولي مشتريان اين مقادير دربازه صفر تا يک قرار مي‌گيرند.
در مورد داده‌هاي شخصي نيز چون اعداد ورودي به شبکه‌هاي عصبي بايد کوچک باشند، داده‌ها را به بازه صفر و يک انتقال مي‌دهيم. پس قبل از آموزش شبکه خود سازمانده، کليه متغيرها اعم از عددي و اسمي به اين بازه نگاشته شده‌اند. در اين تحقيق براي تبديل متغيرهاي اسمي به متغيرهاي عددي، از رويکرد کدگذاري 1 از 1-N استفاده شده است. اين عمل باعث افزايش تعداد متغيرها مي‌شود زيرا به تعداد مقادير هر متغير اسمي منهاي يک، متغير توليد مي‌شود. به اين ترتيب متغيرهاي جمعيت‌شناختي مورد بررسي ما از 3 به 5 افزايش مي‌يابد (جدول4-4). به عنوان مثال براي تبديل متغير اسمي به متغير عددي، به اين ترتيب عمل نموديم که متغير تحصيلات را با سه متغير ديپلم و زير ديپلم، ليسانس و فوق ديپلم، فوق ليسانس جايگزين نموديم اگر مشتري تحصيلاتش ديپلم و زير ديپلم باشد، مقدار متغير ديپلم و زير ديپلم معادل 1، ليسانس و فوق ديپلم معادل صفر و فوق ليسانس نيز معادل صفر خواهد شد. همچنين اگر مشتري تحصيلاتش دکتري باشد هر سه متغير معادل صفر مي‌شوند. به اين ترتيب همه متغيرهاي اسمي به عددي تبديل شدند. چگونگي اين تبديل‌ها در جدول 4-3 آمده است.

جدول 4-3 تبديل متغير اسمي تحصيلات به متغير عددي با استفاده از کدگذاري 1 از 1-N
کدگذاري 1 از 1-N
تحصيلات
ديپلم و زير ديپلم
ليسانس و فوق ديپلم
فوق ليسانس
ديپلم و زير ديپلم
1
0
0
ليسانس و فوق ديپلم
0
1
0
فوق ليسانس
0
0
1
دکتري
0
0
0

جدول4-4 متغيرها بعد از کدگذاري 1 از 1-N
شماره متغير
نام متغير
1
جنسيت-مرد
2
سن
3
ديپلم و زير ديپلم
4
ليسانس و فوق ديپلم
5
فوق ليسانس

4-4 تعيين وزن پارامترهاي تراکنشي (RFM) با استفاده از فرآيند تحليل سلسله مراتبي
ضريب اهميت (وزن) شاخص‌ها در مکان‌هاي تجاري مختلف يکسان نيستند. بعضي شاخص‌ها بر شاخص‌هاي ديگر ارجعيت بيشتر يا کمتري دارند. روش‌هاي مختلفي مانند روش آنتروپي، بردار ويژه، روش اسمارت، روش تحليل سلسله مراتبي163 براي تعيين وزن شاخص‌ها وجود دارد. متداول‌ترين روش براي محاسبه‌ي وزن متغيرهاي مدل RFM طبق ادبيات، تکنيک تحليل سلسله مراتبي مي‌باشد. روش AHP يک تکنيک قوي و يک ابزار انعطاف‌پذير و چند معياره به منظور تصميم‌گيري در مسائل پيچيده است که دو مفهوم کيفي و کمي را مدنظر قرار مي‌دهد (برتوليني164 و همکاران، 2006).
اين تکنيک با انجام مقايسات دو به دو بين عناصر تصميم و از طريق تخصيص امتياز عددي که نشان دهنده ارجحيت يا اهميت بين دو عنصر تصميم مي‌باشد، صورت مي‌گيرد. در جدول 4-5 نحوه‌ي ارزش‌گذاري شاخص‌ها نسبت به هم نشان داده شده است.
جدول 4-5 جدول امتيازدهي به شاخص هاي i وj نسبت به

دسته بندی : No category

دیدگاهتان را بنویسید