روش دادههای ترکیبی )پانل دیتا( روشی برای تلفیق دادههای مقطعی و سری زمانی است. مزیت این روش در این است که معمولاً روشهای سنتی اقتصاد سنجی بر سریهای زمانی و دادههای مقطعی، ناهماهنگیهای مربوط به واحدها یا گروهها را لحاظ نمیکنند و نتایج دارای ریسک تورش دار بودن است. این نوع ناهمگنیها در روش دادههای پانل در نظر گرفته میشوند و برآوردهای نا اریب و سازگارتری را ارائه میدهند. مهمترین مزیت استفاده از روش دادههای ترکیبی، کنترل نمودن خواص ناهمگن و در نظر گرفتن تک تک افراد، شرکتها، ایالت و کشورها است. درحالیکه مطالعات مقطعی و سری زمانی این ناهمگنی را کنترل نکرده و با تخمین الگو بدان روشها، بیم اریب در نتایج میرود.
در واقع با بهره گرفتن از دادههای ترکیبی، شناسایی و اندازهگیری تأثیراتی که به سادگی در دادههای مقطعی و سری زمانی قابل شناسایی نیست، امکانپذیر میشود. قبل از ورود به بحث تخمین و تجزیه و تحلیل الگو لازم است در ابتدا این مسئله که چرا مطالعه به صورت پانل مورد مطالعه قرار میگیرد، معین شود. به عبادت دیگر آیا مقاطع همگن هستند یا خیر؟
۵٫۹٫۳ آزمون قابلیت برآورد الگو به صورت پانل
برای انتخاب مسئله ناهمگنی واحدها میتوان از F لیمر کمک گرفت. در صورت تأیید ناهمگنی واحدها، الگو از طریق دادههای پانل برآورد میشود و در غیر این صورت به روش OLSمعمولی یا Pooling Data برآورد میشود. آمارهی F بدین شکل تعریف میشود:
در رابطه فوق PRSS نشانگر مجموع مجذورات پسماندهای مقید و URSS مجموع مجذورات پسماندهای غیر مقید است. N تعداد مقاطع و T تعداد سالهای دوره زمانی و K تعداد پارامترها میباشد.
در آزمون قابلیت آزمون برآورد به صورت پانل دیتا فرضیه صفر مبتنی بر عدم ناهمگنی میان واحدها یا مقاطع میباشد و فرضیه مقابل آن بیانگر ناهمگنی در بین مقاطع یا واحدها میباشد به بیان آماری داریم:
که ها بیان کننده اثرات فردی یا ناهمگنی است.
در آزمون فرضیه صفر، اگر F محاسبه شده از F جدول با درجه آزادیهای N-1 و NT-N-K بزرگتر باشد، فرضیهی رد میشود. بنابراین الگو رگرسیونی به روش ددادههای پانل برآورد میشود. در غیر این صورت از روش OLS معمولی (پولینگ دیتا) برای برآورد مدل استفاده میشود.
۶٫۹٫۳ اثرات ثابت و اثرات تصادفی
در صورتی که دادههای آماری به گونهای بود که مقاطع دارای عکسالعملهای متفاوتی باشند و برای هر مقطع عرض از مبدأ جداگانهای در نظر گرفته شود، باید منشأ خطاهای ناشی از تخمین نیز مشخص شود. به بیان دیگر، باید مشخص شود که خطای ناشی از تخمین در طی زمان اتفاق افتاده است یا اینکه که خطای نام برده شده علاوه بر اینکه در طی زمان اتفاق افتاده به دلیل تغییر در مقاطع نیز بوده است. در نحوهی در نظر گرفتن چنین خطاهای با دو اثر، اثرات ثابت (Fixed Effect) و اثرات تصادفی (Random Effect) مواجه خواهید بود. در اثرات ثابت، خطای تخمین ناشی از تغییر مقاطع در عرض از مبدأ منظور میگردد ولی در مدل اثر تصادفی چنین خطاهایی به- طور تصادفی در نظر گرفته میشود. به بیان آماری میتوان این گونه توضیح داد که:
اگر جملات اخلال را به صورت زیر بنویسیم:
که در آن خطای جزئی است که با مشاهدات همبسته نیست. و مربوط به مقاطع است، که ممکن است با مشاهدات همبسته باشد یا نباشد.
در رویکرد اثرات ثابت ها با مشاهدات همبسته است، ولی در رویکرد اثرات تصادفی ها با مشاهدات همبسته نیستند. الگوی اثر تصادفی فرض میکند یک جمله تصادفی برای هر گروه است، اما در هر دورهی زمانی، از این توزیع تصادفی ها فقط یک رخداد به طور یکسان در هر دوره در الگوی رگرسیونی وارد میشود (اشرف زاده و مهرگان، ۱۳۸۷).
در الگوی اثرات ثابت، عرض از مبدأ در الگوی رگرسیون بدین دلیل بین افراد متفاوت است که هر فرد یا واحد مقطعی، ویژگیهای خاص خود را داراست. در الگوی اثرات تصادفی فرض میشود که عرض از مبدأ یک واحد تکی، انتخابی تصادفی از جامعههای بزرگتر با میانگین ثابت است. بدین ترتیب عرض از مبدأ تکی، به صورت انحرافی از میانگین ثابت بیان میشود .
چنانچه فرضیهی صفر آمارهی F لیمر مبتنی بر پولینگ بودن رد شود و دلیلی برای پذیرش فرضیهی صفر وجود نداشته باشد. فرضیه مقابل آن مبنی بر پانل دیتا بودن دادههای آماری مورد پذیرش قرار میگیرد. برای انتخاب بین اثرات ثابت FEM و اثرات تصادفی REM از آزمون هاسمن استفاده میشود.
۱٫۶٫۹٫۳ آزمون هاسمن[۳۹]
برای انتخاب بین الگوهای اثرات تصادفی و اثرات ثابت از آزمون هاسمن استفاده میشود. این آزمون به شکل زیر است:
در رابطه فوق r تعداد پارامترها، w دارای توزیع با درجه آزادی تعداد پارامترها است که در آن ماتریس کوواریانس برای ضرایب الگوی ثابت ( ) و ماتریس کوواریانس الگوی اثرات تصادفی ( ) است. اگر و همبسته باشند، و میتوانند به طور معنی داری متفاوت باشند و این انتظار وجود دارد تا این امر در آزمون منعکس شود. در آزمون هاسمن، فرضیهی صفر مبتنی بر اثر تصادفی بودن دادههای آماری است. چنانچه فرضیهی صفر رد شود و دلیلی برای پذیرش آن وجود نداشته باشد، فرضیهی مقابل آن مبتنی بر ثابت دادههای آماری پذیرفته میشود. در روش دادههای ترکیبی که طول سریهای زمانی آن قابل توجه باشد، برای اطمینان از عدم کاذب بودن رگرسیون برآوردی، همانند روش OLS معمولی نیاز به بررسی پایایی متغیرهای مدل است که در صورت ناپایا بودن آن باید آزمونهای هم جمعی نیز مورد بررسی قرار گیرد.
۱۰٫۳ خلاصه فصل
در این فصل ابتدا در مورد روش تحقیق توضیح داده شد که روش تحقیق حاضر از نظر هدف از نوع کاربردی بوده و سپس به بررسی فرضیات و مدل تحقیق پرداخته شد. در ادامه نحوه محاسبه هر کدام از متغیرها و نحوه جمع آوری دادههای آنها از سازمان بورس اوراق بهادار و سایت بانک مرکزی مورد بررسی قرار گرفت. در نهایت در مورد آزمونهای بکار گرفته برای بررسی فرضیات بحث شد.
فصل چهارم
تجزیه و تحلیل دادهها
مقدمه
پژوهشگر پس از این که روش تحقیق خود را مشخص کرد و با بهره گرفتن از ابزارهای مناسب، دادههای مورد نیاز را برای آزمون فرضیههای خود جمع آوری کرد، اکنون نوبت آن است که با بهره گیری از تکنیکهای آماری مناسبی که با روش تحقیق، نوع متغیرها، … سازگاری دارد، دادههای جمع آوری شده را دسته بندی و تجزیه و تحلیل نماید و در نهایت فرضیههایی را که تا این مرحله او را در تحقیق هدایت کردهاند در بوته آزمون قرار دهد (خاکی،۱۳۸۷،ص۳۰۵-۳۰۳).
۱٫۴ آمار توصیفی
جدول(۴-۱): نتایج آمار توصیفی برای هر سه صنعت از سال ۱۳۸۰ تا ۱۳۹۰
نرخ ارز(دلار) | ارزش افزوده اقتصادی | ارزش افزوده اقتصادی تعدیل شده | تورم | |
میانگین | ۹۲۲٫۸۱۸ | -۱۷۰۵۸٫۶۹ | -۱٫۰۵E+12 | ۱۵٫۳۴۵ |
انحراف معیار |