دادههای مقطع زمانی، مقادیر یک متغیر را در زمان معین و روی واحدهای متعدد اندازه گیری میکند. این واحدها میتوانند افراد، خانوارها، واحدهای تولیدی، صنایع، نواحی مختلف و حتی کشورهای مختلف باشند. مثلا میتوان دادههای درآمد و مصرف خانوارهای مختلف را در سال معینی جمع آوری کرد. معمولاً از اندیس i برای دادههای مقطعی استفاده می کنند.
دادههای تلفیقی در واقع بیان کننده دادههای مقطعی در طی زمان هستند. بنابراین حجم مشاهدات در دادههای تلفیقی نسبتا زیاد است.
در سالهای اخیر، کاربرد دادههای تلفیقی در اقتصادسنجی افزایش بسیاری یافته است. معمولاً دادههای تلفیقی و دادههای مقطعی در اقتصادسنجی خرد به کار می روند که موضوع آن بررسی روشهای اقتصادسنجی در اقتصاد خرد است. یکی از قابلیت های نرم افزار Eviews ترکیب دادههای مقطعی و زمانی است و می توان مدل رگرسیون با دادههای ترکیبی را اجرا نمود. در تحقیق حاضر روش آماری استفاده شده به منظور تجزیه و تحلیل دادهها، روش رگرسیون چند متغیره با بهره گرفتن از دادههای ترکیبی است. لذا نرم افزار استفاده شده نیز نرم افزار Eviews است که قابلیت چنین تجزیه تحلیلی را دارا می باشد.
۳-۱۰-مدل دادههای ترکیبی سری زمانی- مقطعی (پنل)
دادههای ترکیبی به یک مجموعه از دادههایی گفته میشود که بر اساس آن مشاهدات به وسیله تعداد زیادی از متغیر هایی مقطعی (N)، که اغلب به صورت تصادفی انتخاب می شوند، در طول یک دوره زمانی مشخص(T) مورد بررسی قرار گرفته باشند. در این صورت این N×T داده آماری را دادههای ترکیبی یا دادههای مقطعی – سری زمانی می نامند. به این دلیل که دادههای ترکیبی در برگیرنده هر دو جنبه دادههای سری زمانی و دادههای مقطعی است، به کارگیری مدل های توضیح دهنده آماری مناسبی که ویژگی های آن متغیر ها را توصیف کند، پیچیده تر از مدل های استفاده شده در دادههای مقطعی و سری زمانی است. در سال های اخیر از روش ترکیب دادههای مقطعی و سری زمانی در تحقیقات کاربردی زیادی استفاده شدهاست.
۳-۱۱- انواع مدل های بکار رفته در دادههای ترکیبی
یکی از مهمترین مشکلات بررسی های غیر تجربی در تورش ناشی از متغیر های حذف شده یا تخمین زده نشده در برآوردهاست. به این دلیل تحلیل هایی که براساس این قبیل مشاهدات صورت می گیرد، اغلب با واقعیت ها منطبق نیست. بر این اساس، با بهره گرفتن از مدل دادههای ترکیبی، میتوان به تخمین های کارا دست یافت. شکل کلی مدل دادههای ترکیبی که به مدل اجزا خطا معروف است، به صورت زیرمیباشد:
در رابطه فوق Y نشان دهنده متغیر وابسته، X متغیرهای توضیحی مشاهده شده و Z نشان دهنده متغیرهای توضیحی غیر قابل مشاهده اثر گذار بر متغیر وابسته برای هر مقطع بوده که برای توضیح بهتر، این دسته از متغیرها از مقادیر اجزا خطا جدا شدهاست. نماد i نشان دهنده مقطع ها یا واحد های مشاهده شده، t نشان دهنده دوره زمانی و j و pنشان دهنده تفاوت بین متغیرهای مشاهده نشده و مشاهده شده در مدل است. عبارت نشان دهنده خطای برآورد دادههای ترکیبی است که تمامی شرایط مربوط به جملات خطا تحت فرضیات گوس – مارکو را داراست.
۳-۱۲- تحلیل رگرسیون
رگرسیون در لغت به معنای «بازگشت به مراحل قبلی در یک مسیر تحول و توسعه» است. تحلیل رگرسیون درواقع بدنه اصلی مطالعات اقتصادسنجی را تشکیل میدهد و به طور کلی درباره مدلهای رگرسیون و نحوه برآورد آن ها بحث می کند.
برای آشنایی با مفهوم رگرسیون، فرض کنید یک متغیر مثل Y را در طول زمان یا در بین واحدهای مختلف مشاهده کرده و دادههای مربوط به آن را به دست آورده ایم. میخواهیم چگونگی تغییرات آن را تفسیر کنیم. برای این منظور باید متغیر یا متغیرهایی را در نظر بگیریم که بتوانند این تغییرات را توضیح دهند. فرض کنید:
این مدل، یک مدل ریاضی است چرا که فقط رابطه ریاضی بین متغیر وابسته (Y) و متغیرهای مستقل (xiها) را منعکس کرده است. اگر تابع f نسبت به متغیرهای x1 تا xk خطی باشد یعنی به فرم:
این مدل، یک مدل ریاضی خطی نامیده میشود. اینکه چه متغیرهایی باید به عنوان متغیرهای توضیح دهنده استفاده شوند میتواند به تئوریهای اقتصادی یا برداشت شخصی مدل ساز بستگی داشته باشد. شکل تابع نیز تابع نظر مدلساز است و او میتواند شکل های تابعی متفاوتی را امتحان کند که بیشترین سازگاری را با دادههای موجود داشته باشد. اما باید توجه داشت که حتی اگر متغیرهای توضیح دهنده به درستی انتخاب شده باشند و فرم تابعی نیز درست تصریح شده باشد، باز هم مدل ساخته شده یک رابطه همواره درست نخواهد بود. دلایل این امر را میتوان چنین برشمرد:
علاوه بر متغیرهای توضیح دهنده وارد شده در مدل، عوامل دیگری نیز وجود دارند بیان کمی آن ها معمولاً بسیار دشوار است و در نتیجه وارد کردن آن ها در مدل مقدور نیست. به عنوان مثال اگر قصد مدل کردن مصرف یک کشور را داشته باشیم، چگونگی انتظارات مصرف کننده نسبت به تغییر در پارامترهای مختلف اقتصادی و درجه عدم اطمینان نسبت به تغییر در پارامترهای مختلف اقتصادی قابل مشاهده نیستند. ثانیا اقتصاد با رفتار انسانها سر و کار دارد و می دانیم که در رفتار انسان همواره عناصر تصادفی غیرقابل پیش بینی وجود دارد که اساسا نمیتوان آن ها را در مدلهای ریاضی گنجاند. همچنین دلایل دیگری مانند خطا در اندازه گیری متغیرهای وابسته و مستقل میتوان ذکر کرد.
پس باید پذیرفت که مدلهای ریاضی برای توضیح پدیدههای اقتصادی دقیق نیستند و خطا دارند. به این خطا اصطلاحا “جمله اخلال” میگویند زیرا تعادل ریاضی مدل را مختل می کند. به همین دلیل یک جمله خطا (یا ترم تصادفی) به مدل اضافه میکنیم که جانشینی برای اثر همه عوامل نادیده گرفته شده در مدل است. بنابراین تفاوت کلی مدلهای ریاضی و مدلهای رگرسیون در جمله اخلال است. هر گاه به مدلهای ریاضی یک جمله اخلال – که یقینا تصادفی است – اضافه کنیم به یک مدل رگرسیون تبدیل خواهد شد.
به متغیر Y که در سمت چپ معادله قرار دارد، متغیر وابسته و به xiها متغیرهای توضیح دهنده یا رگرسورها گفته میشود. اصطلاحات متغیر برونزا و متغیر درونزا نیز به ترتیب برای xiها و Y به کار میرود زیرا فرض بر این است که مقادیر xiها خارج از مدل مفروض تعیین شده و در نتیجه برونزا هستند در حالی که مقادیر Y در داخل مدل و بر اساس قانونمندی تعیین میشود و به همین دلیل درونزا خواهد بود.
۳-۱۳- فروض کلاسیک
با بررسی مدلهای رگرسیون به سهولت مشاهده میشود که هر گونه پیشرفت در تحلیلهای رگرسیونی متوقف به شناخت بیشتر از جمله اخلال مدل است. در واقع در یک مدل رگرسیون، جمله اخلال با اینکه نقش مهمی ایفا میکند اما بنا به تعریف ناشناخته است. هر گاه کوشش کنیم اجزایی از جمله اخلال را بشناسیم و آنها را اندازه گیری کنیم این اجزای شناخته شده در قسمت معین مدل قرار می گیرد و مجموعه عوامل مجهولی که باقی میمانند جمله اخلال را تشکیل میدهند. بنابراین جمله اخلال هیچگاه قابل مشاهده و اندازه گیری نیست. در نتیجه تنها راه خروج از این تنگنای نظری این است که یک سری فرضهای منطقی در مورد جمله اخلال مطرح کنیم تا بر آن اساس بتوان به تحلیلهای رگرسیونی ادامه داد. این فرض ها با یک فرض در مورد متغیرهای برونزا با عنوان فرض های کلاسیک مدلهای رگرسیون مطرح میشود.
مهمترین نکته در مورد تصادفی بودن آن است. با توجه به تعریفی که از ارائه شد، بدیهی است که این فرض قابل قبول است و خلاف آنرا نمیتوان تصور نمود. یک متغیر تصادفی است و مثل همه متغیرهای تصادفی دارای یک تابع توزیع احتمال و در نتیجه میانگین و واریانس (و بقیه گشتاورها) است. سوال مهمی که میتوان مطرح کرد این است که خصوصیات آماری و شکل تابع توزیع احتمال متغیر تصادفی چیست؟ پاسخ به این سوال فروض کلاسیک نامیده میشود. فروض کلاسیک عبارتند از:
اولین فرض این است که میانگین یا امید ریاضی جمله اخلال صفر است.
این فرض در واقع به این معنی است که به ازای هر مقدار معین از متغیرهای توضیح دهنده، میانگین تمام مقادیر ممکن برابر صفر است. ظهور مقادیر مختلف به اعتبار فرض آزمایشهای فرضی تکراری به ازای مقادیر معین و ثابت متغیرهای توضیح دهنده است. مفهوم کلی این فرض این است که مدل خطای سیستماتیک ندارد.
دومین فرض ثابت بودن واریانس جمله اخلال به ازای مقادیر مختلف متغیرهای مستقل است.
هرگاه واریانس جمله اخلال ثابت باشد، میگوییم مدل واریانس همسان و در غیر این صورت واریانس ناهمسان است.
سومین فرض این است که و به ازای تمامی مقادیر از یکدیگر مستقلند. یعنی کوواریانس آنها صفر است.
به عبارت دیگر هرگاه دو مقدار متفاوت برای متغیرهای مستقل را در نظر بگیریم، فرض بر این است که جملههای اخلال متناظر با آنها از یکدیگر مستقلند. در چنین حالتی میگوییم که جملههای اخلال خود همبستگی ندارند.
چهارمین فرض این است که تابع توزیع جمله اخلال را نرمال بدانیم. بنابراین با توجه به فرضهای اول و دوم و سوم میتوان گفت که دارای توزیع مستقل نرمال با میانگین صفر و واریانس ثابت است.
پنجمین و آخرین فرض از فرضهای کلاسیک این است که متغیرهای توضیح دهنده غیرتصادفی هستند. این فرض بیشتر برای سهولت در استنتاج قضایا و نیز رسیدن به نتایج جالبتر در تخمین پارامترهاست. بدیهی است که میتوان این فرض را نقض کرد و متغیرتوضیح دهنده را به صورت یک متغیر تصادفی در نظر گرفت. به هر حال فرض غیرتصادفی بودن متغیرهای توضیح دهنده بدین معناست که ها از متغیر تصادفی مستقل هستند.
فصل چهارم
تجزیه و تحلیل دادههای آماری
۴-۱- مقدمه
پژوهشگر برای پاسخگویی به مسأله تدوین شده و یا تصمیمگیری در مورد رد یا تأیید فرضیهای که صورت بندی کرده است، به بیان نتایج پژوهش می پردازد. در این فصل «دادههای تجربی» تبدیل به «دادههای آماری» شده در رابطه با هر پرسش، فرضیات توصیف و مورد تجزیه و تحلیل قرار می گیرد.
مقصود از تجزیه و تحلیل عبارتست از دسته بندی، مرتب کردن، دستکاری و خلاصه کردن دادهها به منظور دستیابی به جواب پرسشهای پژوهش. به بیان دیگر در تجزیه و تحلیل، مجموعه هایی وسیع، پیچیده و حتی غیر قابل درک دادهها به واحدها، الگوها و شاخص های قابل درک و مشاهده در مسائل پژوهش تبدیل میشود. به طور کلی تجزیه و تحلیل به منظور تنظیم و خلاصه کردن دادهها به صورت اطلاعاتی روشن، خوانا و تفسیرپذیر به کار می رود. به گونه ای که بتوان روابط موجود در مسائل پژوهش را کشف و بررسی و آزمون نمود.هدف از تحلیل و توصیف در آمار، تحلیل جامعه آماری است که به دو طریق توصیفی و استنباطی عنوان میشود. استفاده از هر کدام از این آمارهها، به نوع تحقیق بستگی دارد که در این پژوهش از هر دو تحلیل آماری استنباطی و توصیفی برای تحقیق و بررسی میدانی استفاده شدهاست.
۴-۲-شاخص های توصیفی متغیرها
به منظور شناخت بهتر ماهیت جامعه ای که در پژوهش مورد مطالعه قرار گرفته است و آشنایی بیشتر با متغیرهای پژوهش، قبل از تجزیه و تحلیل دادههای آماری، لازم است این دادهها توصیف شود. آمار توصیفی به تلخیص، توصیف و توضیح ویژگی های مهم دادهها گفته میشود. توصیف آماری دادهها، گامی در جهت تشخیص الگوی حاکم بر آن ها و پایه ای برای تبیین روابط بین متغیرهایی است که در پژوهش به کار می رود. بر این اساس، قبل از این که به آزمون فرضیه های پژوهش پرداخته شود، متغیرهای پژوهش به صورت خلاصه در جدول شماره (۴-۱) مورد بررسی قرار می گیرد.
جدول ۴-۱- شاخص های توصیف کننده متغیرهای تحقیق در قالب شاخص های مرکزی، شاخص (STATISTICS) پراکندگی و شاخص های شکل توزیع
متغیر وابسته | متغیرهای مستقل | ||
علامت اختصاری |