چون اثر یک ماتریس با مجموع مقادیر ویژه آن برابر است، پس جمله دوم رابطه(I) برابر است با:
برای بدست آوردن جمله اول سمت راست داریم:
بنابراین
(اثبات در پیوست۱)
در نتیجه
(۲ - ۶)
در (۲ - ۶)، جمله اول مربع اریبی و برای تابعی پیوسته از و برای داریم:
همانطور که مشاهده می گردد، این جمله یک تابع اکیدا صعودی از است. جمله دوم (۲ - ۶)، مجموع واریانس های مولفه های برآوردگر ، که تابعی پیوسته و اکیدا نزولی نسبت به است. بنابراین اگر ، انگاه اریبی مولفه های با افزایش افزایش می یابد، هر چند با افزایش واریانس آنها کاهش می یابد.
در رگرسیون ریج معمولی علاقه مندیم مقداری را برای انتخاب کنیم که کاهش در جمله واریانس بزرگتر از افزایش در مربع اریبی باشد. اگر چنین امری بتواند انجام بشود، میانگین مربع خطای برآوردگر ریج معمولی کمتر از واریانس برآوردگر خواهد بود.
حال از مینیمم کردن ( می توان پارامترهای ریج را به صورت زیر بدست آورد:
حال عبارت فوق را برابر صفر قرار داده و را بدست می آوریم.
از آنجائی که معمولا و مجهول می باشند، با قرار دادن برآوردگرهای آنها، برآورد به صورت زیر بدست می آید:
که در آن برآورد میانگین مربعات باقی مانده ها بدست آمده از برآورد و ، امین مولفه در (۲ - ۴) می باشد.
حال با توجه به بدست آمده، برآوردهای مختلف که توسط محققین معرفی شده است را بررسی می کنیم. در ابتدا هوئرل و کنارد در سال ۱۹۷۰ با گرفتن برآوردی به صورت زیر برای (پارامتر ریج)پیشنهاد دادند:
که در آن ماکزیمم مولفه است.
کیبریا[۲۴] در سال ۲۰۰۳ برآوردهای مختلفی را برای ، بر اساس رگرسیون ریج تعمیم یافته و درابتدا با بکار بردن میانگین هندسی[۲۵]ارائه داد:
و سپس برآورد دیگری با بکاربردن میانه[۲۶] برای به صورت زیر ارائه داد.
=
خلف و شوکر[۲۷] در سال ۲۰۰۵ با بهینه کردن برآوردگر ، برآوردگر جدیدی نسبت به برآوردگرهای قبل به صورت زیر ارائه دادند:
که در آن ، ماکزیمم مقادیر ویژه ماتریس است.
در سال ۲۰۰۶ الخمیسی و همکاران[۲۸] با بهره گرفتن از آمیخته های دو برآوردگر و برآورد دیگری را برای بر اساس ماکزیمم و میانه به صورت زیر ارائه دادند:
وقتیکه
با بکار بردن روش های کیبریا (۲۰۰۳)، خلف و شوکر (۲۰۰۵)، الخمیسی و همکاران (۲۰۰۶) و الخمیسی و شوکر (۲۰۰۸) برآوردهای زیر توسط محققین دیگری ارائه شد:
=
=()
=
وقتیکه:
=
۲ – ۲ –تعدیل کردن برآوردگرها
هدف ما در این بخش تعدیل کردن برآوردگرهایی است که در بخش قبل برای پارامتر معرفی شد. خلف و همکاران در سال ۲۰۱۳ با ضرب کردن مقدار در شانزده برآوردگری که در بخش قبل ارائه شد، برآوردگرهای جدیدی را ارائه دادند، که با نشان می دهیم.
دلیل پیشنهاد آنها این بود که وقتی متغیرهای رگرسیونی مستقل باشند، در این صورت مقادیر ویژه ماتریس همگی برابر یک است و هر چه درجه همبستگی بین متغیرهای رگرسیونی بیشتر شود، برخی از مقادیر ویژه کوچکتر و برخی بزرگتر می شوند. همانطور که می بینید در صورت از ماکزیمم مقادیر ویژه استفاده شده است. بنابراین هر چه درجه همبستگی بین متغیرهای رگرسیونی بیشتر باشد، بزرگتر خواهد شد و این باعث می شود که مقدار پارامتر ریج براورد شده بزرگتر شود پس این مقدار تعدیل شده به بزرگتر کردن برآورد پارامتر ریج تکیه دارد. مخصوصا زمانی که درجه همبستگی بین متغیرهای رگرسیونی زیاد است.
در بخش بعد، با یک مطالعه شبیه سازی شده به مقایسه برآوردگرهای بدست آمده برای در این بخش با برآوردگرهای معرفی شده در بخش قبل می پردازیم.
۲ – ۳- یک مطالعه شبیه سازی
در این بخش به وسیله شبیه سازی مونت کارلو و با بهره گرفتن از معیار به مقایسه برآوردگرهای ریج اولیه و برآوردگرهای ریج تعدیل شده که به ترتیب با جایگذاری در (۱ - ۷) بدست می آیند، می پردازیم.
متغیرهای رگرسیونی را از معادله زیر تولید می کنیم:
= +
که در آن از توزیع نرمال استاندارد تولید شده است و مقدار ضریب همبستگی بین دو متغیر رگرسیونی است. در این مطالعه، برای سه مقدار ۸۵/. ، ۹۵/. و۹۹/. در نظر گرفته شده است.
با بهره گرفتن از متغیرهای رگرسیونی تولید شده، معادله رگرسیونی زیر را در نظر می گیریم:
+
که در آن بر اساس شبیه سازی که هوئرل و کنارد در سال ۱۹۷۵، کیبریا در سال ۲۰۰۳ ، مک دونالد و گالارنیو[۲۹] در سال ۱۹۷۵ و مونیز و کیبریا[۳۰] در سال ۲۰۰۹ انجام دادند، محدودیت را بر روی پارامترها در نظر می گیریم. در نظر می گیریم، تعداد مشاهدات، تعداد متغیرهای رگرسیونی و خطای تصادفی است.
همچنین در این مطالعه شبیه سازی و در نظر می گیریم. بر اساس مطالعاتی که قبلا انجام شده است(برای مثال الخمیسی و شوکر در سال ۲۰۰۸ و کیبریا در سال ۲۰۰۳ ) خطاها را از توزیع های تولید می کنیم و تعداد تکرارها را ۲۰۰۰ در نظر می گیریم. سپس برآوردگر میانگین مربع خطای برآوردگرها () را با بهره گرفتن از فرمول زیر بدست می آوریم:
حال برای مقدار و مقدار را در نظر می گیریم.
نتایج این مطالعه شبیه سازی را در جداول (۲ - ۱) تا (۲ – ۶) آورده ایم. ملاحظه می شود که تغییرات و توزیع خطا بر روی برآورد تأثیر می گذارد. همانطور که انتظار داشتیم، افزایش درجه همبستگی () باعث افزایش برآورد می شود. این افزایش در مورد برآوردگر بیشتر از برآوردگر رگرسیون ریج می باشد.
توزیع غیر نرمال برای جمله خطا به همراه درجه بالای ضریب همبستگی باعث افزایش برآورد برای برآوردگر می شود. این دو عامل همچنین باعث افزایش برآورد در برآوردگرهای رگرسیون ریج می شود، مخصوصا وقتی که کوچک باشد.
بر اساس نتایج شبیه سازی می توانیم چند پیشنهاد برای پارامتر ریج داشته باشیم:
۱- اگر آنگاه، در بیشتر موارد برآوردگرهای ریج مربوط به پارامترهای ، ، و دارای کمترین برآورد می باشند. در بین این چهار برآوردگر، اگر ، آنگاه برآوردگرهای ریج مربوط به پارامترهای و دارای کمترین برآورد شده می باشند و اگر ، آنگاه برآوردگرهای ریج مربوط به پارامترهای و را پیشنهاد می دهیم(دارای برآورد شده کمتری هستند).
۲- اگر ، آنگاه در اکثر موارد برآورد برآوردگرهای ریج مربوط به پارامترها ی تعدیل شده کمتر از برآوردگرهای اولیه می باشند. اگر خطاها دارای توزیع نرمال استاندارد باشند و تعداد نمونه ها برای توزیع های غیر نرمال بزرگتر از ۲۵ باشد، آنگاه برآوردگر ریج مربوط به پارامتر در اکثر موارد پیشنهاد می شود. برای نمونه های کوچک در توزیع های غیر نرمال، برآوردگر ریج مربوط به پارامتر اغلب بهترین انتخاب خواهد بود.
۳- اگر و تعداد نمونه ها کم بدون در نظر گرفتن توزیع خطاها برآوردگر ریج مربوط به پارامتر و در اکثر موارد پیشنهاد می شود، همچنین وقتی که تعداد نمونه ها متوسط و زیاد باشد و ، برآوردگر ریج مربوط به پارامتر و اگر ، برآوردگر ریج مربوط به پارامتر و پیشنهاد می شود.
دانلود مطالب پایان نامه ها در رابطه با بررسی روش های مختلف برآوردیابی در رگرسیون ...