همانطور که در فصل قبل گفته شد بیشتر روشهای بیان شده در زمینه رفع ماتی از تصاویر چهره، از نوع بهسازی تک تصویر و بدون استفاده از اطلاعات مرحله آموزش میباشند، لذا این روشها به اندازه کافی از اطلاعات قبلی در مورد شناسایی PSF تصویر استفاده نمیکنند. از طرفی در این روشها یافتن PSF مات کننده تصویر در شرایط نویزی، مشکل و دارای خطای زیاد است؛ در نتیجه PSF مات کننده تصویر به خوبی شناسایی نشده و بنابراین، کیفیت تصاویر بهسازی شده توسط این روشها در بیشتر موارد پایین میباشد.
در این پایان نامه برای مقابله با مشکلات موجود در روشهای مذکور، از دانش قبلی برای شناسایی PSF مربوط به عامل مات کننده تصاویر چهره استفاده میکنیم.
اجزای روش پیشنهادی
در روش پیشنهادی طبق روندنمای نشان داده شده در شکل (۳-۱الف) ابتدا تصاویر چهره مربوط به پایگاه داده مورد نظر را به کمک رابطه (۳-۱) و با بهره گرفتن از چند PSF مشخص و استاندارد، به صورت مصنوعی مات میکنیم. فرایند تخریب یک تصویر با عوامل مخرب نویز و ماتی، در حوزه فرکانس، به صورت رابطه زیر تعریف می شود:
(۳-۱) |
که تصویر چهره شفاف اصلی، پنجره مات کننده تصویر چهره، تصویر چهره مات شده و N مربوط به چگالی طیفی نویز میباشد.
حال به استخراج ویژگی از این تصاویر میپردازیم. نکته قابل توجه در امر استخراج ویژگی این است که با استخراج ویژگی از روی پیکسلهای خام تصاویر مرحله آموزش و ایجاد فضای ویژگی توسط آنها، این نمونهها به راحتی از هم جداپذیر نمیباشند و دقت شناسایی PSF رضایت بخش نمی باشد. در روش پیشنهادی در این پایان نامه برای حل این مشکل از روشی مبتنی بر تشکیل فضای ویژگی بر اساس استخراج ویژگی از اطلاعات بیشینهی اندازه مولفههای فرکانسی تصاویر استفاده شده است. طبق این روش برای نگاشت نمونههای آموزش به فضای ویژگی مورد نظر، ابتدا به کمک تبدیل فوریه دوبعدی، نمونههای آموزش را به حوزه فرکانس منتقل میکنیم. حال با توجه به این نکته که اطلاعات بیشینهی مربوط به اندازه مولفههای فرکانسی کلیه تصاویر مات شده با عامل ماتی مشابه (یعنی کلیه تصاویر متعلق به یک دسته)، در حوزه فرکانس، دارای همبستگی زیاد با یکدیگر اما اختلاف قابل توجه با اطلاعات بیشینهی مربوط به اندازه مولفههای فرکانسی تصاویر متعلق به دستههای دیگر است، تنها اطلاعات مربوط به اندازه مولفههای فرکانسی نمونههای آموزش، ذخیره شده و فضای ویژگی را به کمک آنها تشکیل میدهیم. (در اینجا از اطلاعات مربوط به فاز حوزه فرکانس نمونههای آموزش استفادهای نمی شود). حال ویژگیهای نگاشت یافته به فضای ویژگی را ابتدا نسبت به اندازه فاصله بین ویژگیهای هر بردار نرمالیزه کرده، و سپس از آنها جهت آموزش شبکه عصبی استفاده میکنیم.
با توجه به شکل (۳-۱الف) و به کمک رابطه (۳-۲) در مرحله آموزش، تعداد N دسته از روی نمونههای تصاویر آموزشی که به صورت مصنوعی مات شده اند، ایجاد می شود؛ و هر کدام از این N دسته شامل تصاویر چهره مات شده با PSF مات کننده مشخص میباشند.
(۳-۲) | = {Hi}, i = 1 to N Ω |
که در این رابطه، Ω مجموعه آموزش، Hi تابع گسترش نقطهای مات کننده دسته i ام و N تعداد دستههای موجود در این مجموعه را نشان میدهد.
باید به این نکته توجه داشت که ممکن است در این روش با توجه به کاربرد سیستمهای بازشناسی چهره در موقعیتهای مختلف، برای مات کردن تصاویر چهره از PSF مات کننده مختلفی استفادهکرد؛ برای مثال در این پایان نامه اثر PSF مات کننده مربوط به عامل ماتی بر اثر حرکت[۲۱] و ماتی بر اثر خارج زوم بودن سوژه نسبت به دوربین[۲۲]، بررسی شده است.
شکل (۳-۱): روندنمای مربوط به روش پیشنهادی که شامل دو مرحله است: الف) مرحله آموزش ب) مرحله شناسایی PSF مات کننده تصویر چهره، رفع ماتی، و بازشناسی آن تصویر
طبق روندنمای نشان داده شده در شکل (۳-۱ب)، در مرحله آزمایش نیز ابتدا به کمک شبکه عصبی PSF مات کننده تصویر چهره مات ورودی را شناسایی کرده، و پس از شناسایی این تابع به بهسازی این تصویر با بهره گرفتن از روش دیکانولوشن میپردازیم. در نهایت تصویر بهسازی شده را برای انجام بازشناسی به سیستم بازشناسی چهره تحویل میدهیم.
ایجاد فضای ویژگی
همانطور که در قسمت قبل گفته شد، به منظور رفع ماتی از تصاویر چهره ابتدا باید به شناسایی PSF مات کننده آن تصویر بپردازیم. بدیهی است هرچه این تابع با دقت بالاتری شناسایی شود شاهد نتیجه بهتری در بهسازی آن تصویر خواهیم بود. برای بالا بردن این دقت نیازمند ایجاد یک فضای ویژگی خاص میباشیم. این فضای ویژگی از یک جهت باید نسبت به تغییرات ایجاد شده توسط عوامل مات کننده مختلف در تصاویر چهره، حساس و از طرف دیگر نسبت به تفاوت بین تصویر چهره یک فرد با فرد دیگر غیر حساس باشد. از [۲۷] و توجه به شکل (۳-۲) درمییابیم که بین اندازه مولفههای فرکانس میانی و بالایی مرتبط با تصاویر شفاف و مات اختلاف قابل توجهی وجود دارد. بنابراین با توجه به این وجه تمایز میتوان از آن به عنوان بردار ویژگی استفاده کرد.
شکل (۳-۲): مقایسه بین بردارهای ویژگی موجود در فضاهای ویژگی مختلف [۲۰]. الف) بردار ویژگی مرتبط با اطلاعات تصویر چهره شفاف و مات در حوزه مکان ب) بردار ویژگی مرتبط با اطلاعات اندازه مولفههای فرکانسی تصویر چهره شفاف و مات در حوزه فرکانس ج) بردار ویژگی مرتبط با اطلاعات اندازه مولفههای فرکانسی تصویر چهره شفاف و مات در حوزه فرکانس پس از گرفتن لگاریتم
همانطور که در شکل (۳-۲ الف) دیده می شود، در فضای ویژگی مربوط به حوزه زمان، بین مقدار خام پیکسلهای مرتبط با تصاویر شفاف و مات اختلاف معنادار وجود ندارد و از این مقادیر نمی توان به عنوان بردار ویژگی استفاده کرد. همچنین مطابق با شکل (۳-۲ ب)، در فضای ویژگی ایجاد شده بر اساس اطلاعات مربوط به اندازه مولفه فرکانسی تصاویر شفاف و مات، اختلاف مابین اندازه مولفه فرکانس میانی و بالایی تصاویر شفاف و مات به خوبی آشکار نشده است. میتوان، مطابق شکل (۳-۲ ج) برای آشکار شدن وجه تمایز مابین این بردارهای ویژگی، از اطلاعات مربوط به اندازه مولفه فرکانسی تصاویر شفاف و مات لگاریتم گرفت. حال در فضای ویژگی جدید ایجاد شده، وجه تمایز زیادی بین بردارهای ویژگی مرتبط با هر دسته از تصاویر چهره که با PSF مات کننده مختلفی مات شده اند، وجود دارد. این وجه تمایز بین بردارهای ویژگی خود موجب افزایش کارایی طبقه بندی و درنتیجه افزایش دقت شناسایی PSF مات کننده تصویر ورودی می شود.
در کاربرد جهان واقعی با تصاویر گرفته شده معمولا مقداری نویز همراه می شود، که این نویز در فضای ویژگی مورد نظر، برروی دقت شناسایی PSF مات کننده، تاثیر منفی نسبتا زیادی دارد. برای حل این مشکل، پس از بررسیهای فراوان برروی شکل موج مربوط به اطلاعات اندازه مولفه فرکانسی تصاویر نویزی مات و شفاف، به این نتیجه رسیدیم که اطلاعات بیشینه مربوط به هر سطر از ماتریس نتشکل از اندازه مولفه فرکانسی تصاویر نویزی مات و شفاف دارای تمایز بیشتری نسبت به یکدیگر هستند. لذا از این ویژگی میتوان برای تشکیل بردار ویژگی و استفاده در تخمین PSF استفاده کرد.
حال برای ایجاد فضای ویژگی مورد نظر طبق رابطه (۳-۳) از اطلاعات بیشینه مربوط به هر سطر از ماتریس متشکل از اندازه مولفه فرکانسی تصاویر، استفاده میکنیم.
(۳-۳) |
که در این رابطه تصویر چهره نگاشت یافته به حوزه فرکانس، ویژگیهای استخراج شده از این تصویر، متناظر با مولفه فرکانسی دو بعدی تصاویر، وM تعداد سطرهای هر تصویر میباشند.
پس از آشنایی با نحوه ایجاد فضای ویژگی مربوط به مرحله آموزش، نوبت به آشنایی با نحوه آموزش این فضا جهت شناسایی PSF مات کننده تصویر میرسد.
همانطور که در بخشهای قبل به آن اشاره شد، فضای ویژگی استفاده شده جهت شناسایی PSF مات کننده تصویر ورودی، مجموعه ای از تصاویر چهره میباشند که با بهره گرفتن از PSF مشخص، به صورت مصنوعی مات شده و پس از اضافه شدن نویز به آنها، تصاویر چهره مات شده با PSF مشابه در یک دسته قرار گرفته و بعد از نگاشت تصاویر هر دسته به حوزه فرکانس، از اطلاعات بیشینه مربوط به اندازه مولفه فرکانسی آنها به عنوان ویژگی استفاده میکنیم. حال با نرمالیزه کردن این ویژگیها، آنها را با ترتیب تصادفی به عنوان ورودی به شبکه عصبی طراحی شده اعمال میکنیم.
از آنجا که از یک طرف تعداد ویژگیهای استخراج شده از هر تصویر نسبتا زیاد میباشد (از هر تصویر ۱۰۶ ویژگی)، و از طرف دیگر نیازمند سرعت شناسایی بالا در مرحله آزمایش میباشیم؛ در نتیجه از یک شبکه عصبی که با این شرایط سازگار باشد، استفاده میکنیم. ما در این پایان نامه پس از بررسی شرایط شبکه های عصبی مختلف، از شبکه عصبی MLP[23] استفاده کردهایم.