۰.۰۶۴
۰.۰۱۶
~ cavity
با بهره گرفتن از این جدول میتوان احتمال هر رویداد دلخواه را محاسبه کرد. مثلاً احتمال رویداد cavity ∨ toothache برابر است با:
P (cavity ∨ toothache) = 0.108 + 0.012 + 0.072 + 0.008 + 0.016 + 0.064 = 0.28
همانطور که قبلاً گفته شد، در بسیاری موارد محاسبه احتمال شرطی یک رویداد در حالی که بعضی از مشاهدات داده شده است، مطلوب میباشد. احتمال شرطی رویدادها با بهره گرفتن از فرمول احتمال شرطی و جمع عناصری از جدول توزیع آنها قابل محاسبه است. به عنوان مثال، محاسبه احتمال یک سوراخ در دندان در صورت وجود دندان درد، بصورت زیر میباشد.
در مثالی دیگر میتوان احتمال سوراخ نبودن دندان با وجود دندان درد را نیز محاسبه کرد.
توجه کنید که در این محاسبات بدون توجه به اینکه چه مقداری برای Cavity محاسبه کنیم، ثابت باقی میماند. در واقع، میتوان آن را یک عامل برای نرمالسازی فرض کرد تا توزیع مجموعی برابر ۱ داشته باشد. در طول این بررسی از α برای نشان دادن چنین ثابتهایی استفاده شده است. با این نماد، می توان دو عبارت قبلی را در یک عبارت بصورت زیر خلاصه کرد.
P (Cavity | toothache) = aP (Cavity, toothche) = a < 0.12, 0.08 > = < 0.6, 0.4 >
با تعمیم روش بکار رفته در این مثال به راحتی میتوان به یک رویه استنتاج کلی دست یافت. در اینجا، حالتی که تنها در یک متغیر درخواست وجود دارد را بررسی میکنیم (حالتهای دیگر بسادگی از تعمیم این حالت بدست میآیند). فرض کنید X متغیر درخواست (Cavity در مثال) باشد، E مجموعه متغیرهای مربوط به شواهد را نشان دهد (Toothache در مثال)، e مقادیر مشاهده شده برای E را نشان دهد و Y مجموعه بقیه متغیرهای مشاهده نشده باشد (Catch در مثال). با توجه به این فرضیات، درخواستها در حالت کلی بصورت P(X|e) هستند و میتوان در معادله ۳‑۳۲ آنها را محاسبه کرد.
معادله ۳‑۳۲
در این معادله مجموع بر روی تمامی مقادیر Y ممکن است (یعنی تمامی حالات مقادیر متغیرهای Y). باید توجه داشت که X و E و Y با هم تمامی متغیرهای قلمرو را تشکیل میدهند و یک زیرمجموعه از عناصر جدول توزیع میباشد و بنابراین، مجموع براحتی قابل محاسبه است[۲۰].
همانطور که در قسمت قبل توضیح داده شد، توزیع توام کامل میتواند هر درخواستی را جواب دهد، ولی میتواند بطور غیرقابل کنترلی بزرگ شود. همچنین میدانیم استقلال و یا استقلال شرطی بین متغیرها میتواند تعداد احتمالاتی که برای محاسبه توزیع کامل لازم است، را به طور قابل توجهی کاهش دهد. در ادامه، یک ساختمان داده به نام شبکه بیزی معرفی خواهد شد که نشاندهنده وابستگیهای فرض شده بین متغیرها است و توزیع کامل با توجه به این فرضهای وابستگی بطور دقیق تعیین میشوند.
شبکه بیزی یک گراف جهتدار است که رئوس آن شامل اطلاعات مقادیر احتمالات شرطی هستند. بطور دقیقتر این شبکه شامل اجزا و خصوصیات زیر است.
یک مجموعه از متغیرهای تصادفی، مجموعه رئوس گراف را تشکیل میدهند که این متغیرها میتوانند گسسته یا پیوسته باشند.
یک مجموعه از یالهای جهتدار که اگر یک یال از راس X به راس Y باشد، X را والد Y نامیده می شود.
هر گره Xi، یک توزیع احتمال شرطی دارد که تاثیر گرههای والد بر روی این گره را بصورت عددی نشان میدهند.
گراف هیچ دور جهتداری ندارد و در واقع، یک گراف بدون دور جهتدار است.
ساختار شبکه نشان دهنده وابستگیهای شرطی در قلمرو است. بصورت شهودی، معنی یک یال از X به Y وجود تاثیر مستقیم X بر Y و یا وابستگی مستقیم Y به X است. باید توجه داشت که تعیین این وابستگیهای مستقیم برای یک فرد خبره قلمرو کار مشکلی نمیباشد و به همین دلیل معمولاً در صورت وجود فرد خبره تعیین ساختار شبکه آنچنان سخت نمیباشد. پس از تعیین ساختار، تعیین توزیع شرطی مربوط به گرهها، ساختمان داده شبکه بیزی را کامل میکند و با بهره گرفتن از آن میتوان توزیع توام کامل را بدست آورد که بزودی توضیح داده خواهد شد.
اینک با یک مثال مطالب مذکور توضیح داده خواهد شد. فرض کنید شما به تازگی یک آژیر دزدی خریدهاید که در صورت وقوع دزدی، امکان زیادی دارد که بصدا در آید. علاوه بر این، در صورت وقوع زلزلههای ضعیف هم ممکن است که آژیر بصدا درآید. همچنین، شما دو همسایه به نامهای ماری و جان دارید که قول دادهاند در صورت شنیدن صدای آژیر با شما در محل کارتان تماس بگیرند. جان همیشه در صورت به صدا درآمدن آژیر به شما تلفن میزند. ولی ممکن است که صدای تلفن شما را گاهی با آژیر اشتباه بگیرد و دراین صورت هم تلفن بزند. ماری موسیقی را با صدای بلند دوست دارد و ممکن است گاهی صدای آژیر را نشنود. حالا با توجه به اینکه چه کسی تلفن زده یا نزده است، احتمال دزدی محاسبه می شود. شبکه بیزی این قلمرو در شکل ۳‑۱۱ آمده است.
در ابتدا، ساختار این شبکه و بعد در مورد جدولهای احتمالات شرطی توضیحاتی داده خواهد شد. با توجه به شبکه میتوان دید که دزدی و زلزله بطور مستقیم بر روی بصدا درآمدن آژیر تاثیر میگذارند، ولی بر روی تلفن زدن جان یا ماری تاثیر ندارد، زیرا آنها تنها با شنیدن آژیر تلفن میزنند که این موضوع در دو یال خارج شده از گره مربوط به آژیر در شبکه معلوم است. بنابراین شبکه نشان میدهد که آنها از وقوع زلزله خفیف آگاه نمیشوند.
باید توجه داشت که گرهای برای نشان دادن اینکه ماری به موسیقی گوش میدهد و یا تلفن زنگ میزند در شبکه نیست. این موارد در عدم قطعیت (احتمالی بودن) مربوط به یالهای خروجی از گره به صدا درآمدن آژیر تاثیر داده شده است. به طور کلی روشی برای اینکه به چه عواملی باید در شبکه گره اختصاص داد، وجود ندارد. در واقع، احتمالات شرطی، تمامی عواملی که در شبکه صریحاً نیامدهاند، را به طور خلاصه در خود دارند. به این طریق، یک عامل[۳۵] ساده میتواند به طور تقریبی با یک دنیای پیچیده را مدل کند. میزان این تقریب را میتوان با اضافه کردن اطلاعات مرتبط به شبکه افزایش داد.
شکل ۳‑۱۱: شبکه بیزی قلمرو دستگاه آژیر جدید.
توزیعهای شرطی گرهها را با جدولهای احتمالات شرطی نشان میدهند (البته اگر توزیعها پیوسته باشد از روشهای دیگری استفاده میشود که بعداً به آنها اشاره خواهد شد). هر سطر در این جدولها نشان دهنده مقدار احتمال مقادیر متغیر راس برای یک حالت شرطی خاصی میباشد. هر حالت شرطی یکی از مقداردهیهای ممکن به والدین راس را نشان میدهد. در جدول آخرین مقدار ممکن برای متغیر راس نمایش داده نمیشود، زیرا برابر یک منهای جمع احتمال بقیه مقادیر است. به طور کلی، یک جدول برای یک متغیر بولی با k والد بولی، مقدار باید داشته باشد. یک راس که هیچ والدی ندارد تنها شامل یک سطر است که احتمالات اولیه مقادیر متغیر راس را نشان میدهند.
رابطههای استقلال شرطی در شبکههای بیزی
تا کنون یک مفهوم عددی برای شبکههای بیزی ارائه کردیم و نشان دادیم چگونه با بهره گرفتن از این مفهوم میتوان ساختار شبکه بیزی را بدست آورد. در حقیقت، برعکس این کار هم را میتوان انجام داد. میتوان از مفاهیم ساختاری (که وابستگیهای شرطی کد شده در ساختار گرافی را نشان میدهد) برای بدست آوردن جدولهای احتمالات شرطی و در نتیجه، بدست آوردن مفاهیم عددی استفاده شود. مفاهیم ساختاری با یکی از دو صورت زیر که معادل هستند میتواند بدست آید.
یک گره بصورت شرطی مستقل از گرههای غیربچه خود است در صورتی که والدهای آن را داده باشند و برای مثال در شکل ۳‑۱۱، JohnCalls از Burglary و Earthquake در صورت داده شده بودن مقدار Alarm مستقل است.
یک گره بصورت شرطی مستقل از تمامی گرههای دیگر شبکه در صورت داده شده بودن والدهای آن، فرزندان و والدهای فرزندان آن (یا به عبارت دیگر در صورت داده شده بودن پوشش مارکوفی[۳۶] آن) است. مثلاً Burglary مستقل از JohnCalls وMaryCalls در صورتی که مقادیر Alarm و Earthquake داده شده باشند، است.
توصیفی از این دو نوع نمایش در شکل ۳‑۱۲ آمده است. از این نوع بیان استقلالها و جداول احتمالات شرطی میتوان توزیع توام را بدست آورد. بنابراین مفاهیم عددی و مفاهیم ساختاری معادل هستند.
شکل ۳‑۱۲: ارائه مفاهیم ساختاری به دو صورت معمول.
نمایش کارآمد توزیعهای شرطی
در مورد تعیین جدول احتمالات شرطی باید توجه داشت که حتی اگر تعداد والدهای یک گره یک عدد کوچک K باشد، باید مقدار برای آن گره محاسبه شود که به دانش زیادی برای تعیین این تعداد مقدار نیاز است. در حقیقت، این بدترین حالات است که فرض کنیم رابطه فرزندان و والدین دلخواه است و بسیاری مواقع یک رابطه مشخص و استاندارد بین مقادیر والدها و بچه برقرار است که کار تعیین توزیع شرطی را ساده میکند. مثلاً یک گره ممکن است لزوماً فصل مقادیر بولی والدین خود باشد.
علاوه بر این، بسیاری از مسائل دنیای واقعی متغیرهایی پیوسته دارند. نمایش احتمالات شرطی این متغیرها بصورت جدول ممکن نمیباشد. در اینگونه موارد از دو روش کلی استفاده میشود. یک روش گسسته کردن مقادیر متغیرهای پیوسته است و ایجاد جدولهای احتمالات شرطی برای مقادیر گسسته آنها است. مشکل این روش این است که کارایی روش و دقت آن به شدت افت میکند و علاوه بر آن، اندازه جداول نیز بسیار بزرگ میشود. روش دیگر استفاده از توزیعهای پیوسته استاندارد است که با مجموعهای متناهی از پارامترها تعریف میشوند.
یادگیری شبکههای بیزین
یکی از مشکلات استفاده از شبکههای بیزین این است که ایجاد کامل شبکه حتی برای یک خبره هم میتواند مشکل باشد. بنابراین، تلاشهای زیادی برای یادگیری شبکههای بیزین صورت گرفته است. در هر شبکه بیزین ساختار آن و جداول احتمالات شرطی تعیین کننده آن هستند. بنابراین، باید بتوان با فرایند یادگیری این دو مورد را تعیین کرد. برای یادگیری خودکار ساختار شبکه یکی از روشهای اصلی بر پایه تعیین وابستگی بین متغیرها بنا نهاده شده است. برای تعیین این وابستگیها معیارهای زیادی مانند معیار آنتروپی طراحی شدهاست. با بهره گرفتن از این معیارها مانند روشی که قبلاً توضیح داده شد، وابستگی هر متغیر Xi را نسبت به متغیرهای X1,…,Xi-1 سنجیده می شود و آنها که معیار وابستگیشان از یک آستانهای بیشتر بود، به عنوان والدهای Xi انتخاب میشوند. پس از تعیین ساختار، اگر مقدار همه متغیرها به طور کامل قابل مشاهده باشند، از تخمین احتمال معمولی (گرفتن تعدادی نمونه و شمردن تعداد اتفاقات یک رویداد در این مجموعه نمونه) استفاده می شود. اگر بعضی از متغیرها قابل مشاهده نباشند، با بهره گرفتن از آموزش یک شبکه نورونی میتوان مقادیر جداول احتمالات شرطی را یاد گرفت.
شبکه های باوری بیزین
شبکه باوری بیزین (BBN) یک زبان گرافیکی رسمی برای ارائه و مخابره سناریوهای تصمیم گیریای است که در شرایط عدم قطعیت به استدلال نیاز دارند [۱۹]. یکی از قابلیت های شبکه باوری بیزین این است که انجام استدلال عدم قطعیت کارامدی را با تعداد بسیاری از متغیرهای حوزهای ممکن می کند. روش بهتری را برای استنباط با ترکیب کردن شواهدی از داده ها با دانشهای موجود فراهم می کند. بدلیل طراحی و کاربرد آسان BBN، از آن در بسیاری از حوزه ها استفاده می شود. Almond و Mislevy به ساختاری کلی برای ارزیابی بر اساس مدلهای گرافیکی، بخصوص شبکه های باوری بیزین برای منظور حذف کردن پیچیدگی های موجود در IRT، دست یافتند. این مدلها، روشهایی را برای استنباط کردن در مورد مهارت ها و دانشهای چند جانبهای فراهم می کنند. متغیرهایی که ارائهکننده تمامی منابع تغییرپذیری در یک MIRT هستند در مدل گرافیکی مورد نظر با تجزیه و تحلیل دقیق کارشناسان حوزه در مورد مشکل، وارد شده اند. راه کار مورد نظر از دو مدل به نام های مدل دانش آموز و مدل شواهد استفاده کرده است. مدل دانش آموز متشکل از نودهایی می شود که نشاندهنده تواناییها و تصورات غلط و وابسته آنها به یکدیگر است در حالی که مدل شواهدی متشکل از نودهایی است که ارائهکننده پاسخهای سوالها هستند.
هر مهارت Ai و سوال Rj توسط متغیرهای رندمی نشان داده شده است. متغیر های چند بعدی A و R را به ترتیب اینطور در نظر بگیرید: (A1,A2, . . . , Am) و (R1, R2,. . . , Rk). مدل دانش آموز به شکل P(A) آمده است در حالی که مدل شواهدی به شکل P(Rj |Ai) برای هر سوال Rj∈R آمده است. Ai دستهای از توانایی هاست که سوالهای Rj به آنها وابستهاند. از لحاظ ریاضیاتی، Rj مستقل از تواناییهای Aq ∈ AAi می باشد. مدل دانش آموز روابط بین مهارت ها را با بهره گرفتن از توزیع احتمال مشترک P(A) تعریف شده بر روی متغیرهای مدل دانش آموز، شرح میدهد. مدل احتمال سراسری مسئله به عنوان شبکه باوری بیزین در معادله ۳‑۳۳ نشان داده شده است.