در رابطه ۳-۷، متغیرهای متغیرهای مستقل مدل بوده، Y متغیر وابسته و ضرایب رگرسیون جزئی و مقدار عرض از مبدأ میباشند.
ارزیابی توسعه ICA
بهمنظور بررسی برازندگی و کیفیت ICA جدید در فرایند خوشهبندی، الگوریتم ICAجدید در نرمافزار متلب[۱۵۱] پیادهسازی شده و از معیار SSE[152] در ۳ مجموعه داده آماده و مشهور IRIS، WINE و CMC استفاده خواهد شد. معیار SSE میزان پراکندگی داده ها در هر خوشه را مشخص کرده و از این طریق کیفیت الگوریتمها قابل مقایسه می شود. روش محاسبه SSE در رابطه ۳-۸ نشان داده شده است.
(۳-۸) |
در رابطه ۳-۸، k تعداد خوشه ها، X یکی از عناصر موجود در خوشه و n تعداد ویژگیهای هر داده است. برای هر عنصر(X)، مجموع فاصله ویژگیهای آن داده نسبت به مرکز خوشه() نشاندهنده اختلاف آن داده تا مرکز خوشه است. مجموع اختلاف تمامی داده ها از مراکز خوشههای متناظر، معیار SSE را تشکیل میدهد.
جمعبندی
در این فصل، مدل تعیین ارزش مسافران طراحی و توسعه داده شد. مدل توسعه داده شده از ۳ بخش اصلی تـوسعه مدل RFM در تعیین ارزش مسـافران، خوشهبندی مسافران و تعیین ارزش مورد انتظار مسافران تشکیل شـده است. در ادامه و در فصل بعد مدل ارائه شده بر روی داده های واقعی پیادهسازی شده تا کیفیت آن مشخص گردد.
فصل ۴: نتایج و تفسیر آنها
مقدمه
در فصل قبل، مدل تعیین ارزش مسافران بصورت تئوری و براساس مطالعات پیشین توسعه داده شد. در این فصل این مدل با بهره گرفتن از داده های موجود در دنیای واقعی مورد بررسی قرار خواهد گرفت تا کیفیت و اثربخشی آن تعیین شود. در ادامه این فصل، ابتدا در بخش اول، الگوریتم رقابت استعماری توسعه داده شده مورد بررسی و آزمایش قرار خواهد گرفت و در بخش دوم مدل تعیین ارزش مسافران ارزیابی خواهد شد.
ارزیابی توسعه ICA
همانگونه که در بخش ۳-۳-۲ بیان شد، برای ارزیابی الگوریتم توسعه داده شده رقابت استعماری، از معیار SSE بر روی ۳ مجموعه داده آماده و مشهور IRIS، WINE و CMC استفاده خواهد شد. از اینرو، الگوریتم توسعه داده شده با بهره گرفتن از نرمافزار متلب و با بهره گیری از سیستمی با پردازنده ۵ هستهای و حافظه داخلی ۸ گیگابایت پیادهسازی گردیده است. نتایج حاصل از این ارزیابیها در ادامه تشریح شده است.
مجموعه داده IRIS
این مجموعه داده حاوی ویژگیهای ۳ نوع متفاوت از گل زنبق است که در ۱۹۳۶ توسط فیشر[۱۵۳] برای نشان دادن تکنیـکهای خطی تفکیک پذیر معرفی گردید[۱۱۸]. این مجموعه شامل ۵۰ نمونه از سه نوع گل زنبق با نامهای سیتوسا[۱۵۴]، وریجینیکا[۱۵۵] و ورسیکولار[۱۵۶] میباشد. برای هریک از ۵۰ نمونه آورده شده، ۴ خصوصیت وجود دارد، پهنای گلبرگ، طول گلبرگ، پهنای کاسبرگ و طول کاسبرگ. نتایج حاصل از ۱۰۰ بار خوشهبندی این مجموعه توسط الگوریتمهای مختلف تکاملی، در جدول۴- ۱ نشان داده شده است.
جدول۴- ۱ نتایج خوشه بندی مجموعه داده IRIS
الگوریتم تکاملی | تابع هزینه | |||
حداقل | میانگین | حداکثر | انحراف معیار | |
ICA(new) | ۹۶٫۵۲۵۵ | ۹۶٫۵۷۲۰۵ | ۹۷٫۵۱۴۱۳ | ۰٫۱۰۶۰۲ |
ICA | ۹۶٫۶۹۹۷ | ۹۶٫۸۴۶۶ | ۹۷٫۰۰۵۹ | ۰٫۱۱۱۴ |