کارهای پژوهشی زیادی با این رویکرد انجام شدهاند که تا حدودی شبیه کار پژوهشی فوق میباشند. محققین در این کارهای پژوهشی سعی کرده اند با تحلیل اطلاعات موجود در فایلهای توصیفی به نتایج بهتری نسبت به الگوریتمهای کشف وبسرویس بر اساس کلمات کلیدی دست یابند. ولی یکی از کارهایی که با این رویکرد انجام شده است و تا حدودی متفاوتتر از کارهای دیگر است، کار پژوهشی آقای مارکو[۱۰۵] و همکارانش [۴] است که سعی کردند علاوه بر تحلیل و طبقه بندی وبسرویسها بر اساس اطلاعات موجود در فایلهای توصیفی، به کاربران خود در ایجاد درخواست مناسب کمک کنند. در ادامه نحوهی پیادهسازی این الگوریتم به صورت مختصر شرح داده خواهد شد.
شکل ۳-۶ شمای کلی الگوریتم ارائه شده توسط آقای مارکو و همکارانش را نشان میدهد. همانطور که در شکل قابل مشاهده است مکانیزم یافتن وبسرویس مناسب شش مرحله ای است که به شرح زیر میباشند.
مرحله اول الگوریتم، مهمترین بخش الگوریتم محسوب می شود که سعی شده است با بهره گرفتن از تکنیک[۱۰۶]QBE به کاربران ر ایجاد درخواست مناسب کمک شود. تکنیک QBE امروزه به عنوان یک زبان پرس و جوی گرافیکی در بیشتر سیستمهای مدیریت پایگاه داده مثل اوراکل و SQL مورد استفاده قرار میگیرد. امکانی که این تکنیک برای کاربران پایگاه داده فراهم میکند به این صورت است که امروزه کاربران در سیستمهای مدیریت پایگاه دادهها به جای اینکه برای عملیات پرس و جو، درج، حذف و ویرایش از دستورات SQL استفاده کنند، از امکانات گرافیکی پایگاه دادهها برای نوشتن چنین عملیاتی استفاده میکنند. در این مقاله نیز سعی شده است تکنیک مشابهی را برای کمک به کاربران فراهم کنند که البته درباره نحوهی پیادهسازی آن توضیح زیادی داده نشده است.
شکل ۳- ۵ : نحوهی استفاده از تکنیک QBE در سیستم مدیریت پایگاه دادهی SQL
در این بخش درخواست ایجاد شده در مرحله قبلی مورد پردازش قرار میگیرد تا کلمات کلیدی نامرتبط از درخواست کاربران حذف شود و همچنین از تکنیکهای داده کاوی برای ارتباط برقرار کردن بین کلمات متفاوت استفاده میشود. این بخش در زمان انتشار وبسرویس در سیستم مورد استفاده قرار میگیرد و دقیقاً تمام کارهایی که بر روی درخواستهای ایجاد شده اعمال شدهاند، بر روی اطلاعاتی که به منظور انتشار وبسرویس به سیستم داده میشود، اعمال میشود.
در مرحله سوم خروجی مرحلهی قبل (هم درخواستهای کاربران و هم اطلاعات مربوط به انتشار وب سرویسها) به بردارهای فضایی چند بعدی[۱۰۷] تبدیل میشود.
در این مرحله وبسرویسها به صورت خودکار در گروههای مناسب طبقه بندی میشوند که این عمل باعث میشود فضای حالت جستجو هنگام یافتن وبسرویس مناسب کاهش پیدا کند. علاوه بر این، گروههایی که درخواست کاربر باید با وب سرویسهای آن گروه ها مقایسه شود، در این مرحله مشخص میشود.
با مشخص شدن گروههای مورد نظر، بردار فضایی چند بعدی درخواست ایجاد شده فقط با بردارهای فضایی چند بعدی وب سرویسهای گروهها مقایسه شوند.
در این مرحله نیز چند وبسرویس به عنوان نتیجهی مقایسهی مرحله قبلی به کاربر برگردانده میشود.
Inquiry+API
Publish+API
Preprocessor
Vector Creator
Vector Finder
Classifier
UDDI Communicator
Save service
RetrieveWSDLFor(56)
Internet
return
UDDI
Id:37
Id:54
Internet
Publisher
Discover
?
?
?
?
Internet
Service-Oriented application
Look for
?
Id:54
WSQBE Registry
UDDI Registry
Local area network
شکل ۳-۶ : شمای کلی الگوریتم پیشنهادی مرجع [۴]
۳-۳-۱ مزایا و معایب الگوریتمهای کشف وب سرویس بر اساس تحلیل نحوی
همانطور که در نحوهی پیادهسازی الگوریتمهای فوق بحث شد، این نوع الگوریتم به دلیل تجزیه و تحلیل تمام اطلاعات موجود در فایلهای توصیفی WSDL کارایی بهتری نسبت به الگوریتمهای کشف وبسرویس بر اساس کلمات کلیدی دارند ولی با این حال اغلب مشکلاتی الگوریتمهای کشف وبسرویس بر اساس کلمات کلیدی را دارند.
۳-۴ الگوریتمهای کشف وبسرویس بر اساس معنا
همانطور که در بخش قبلی بررسی شد الگوریتمهای کشف وبسرویس بر اساس تحلیل لغوی با وجود استفاده از تمامی اطلاعات موجود در فایلهای توصیفی WSDL، همچنان در بازگرداندن وبسرویسهای مناسب به کاربران با مشکل روبهرو هستند. دلیل اصلی این نقص، نارسایی فرمت استاندارد WSDL مورد استفاده در فایلهای توصیفی وبسرویسها است. وقتی که فایلهای توصیفی وبسرویسها را با فرمت WSDL در مخازن ثبت سرویس انتشار میدهیم، تنها اطلاعاتی که میتوانیم در فایلهای توصیفی ذخیره کنیم فقط اطلاعات مربوط به آن وبسرویس میباشد. در این صورت چیزی که در مخازن ثبت سرویس خواهیم داشت، فایلهای توصیفی جدا از هم خواهند بود که هیچ کدام از آنها با دیگری رابطهای ندارند. هر چند که بسیاری از سیستمهای کشف وبسرویس از الگوریتمهای طبقه بندی گوناگونی برای قرار دادن وب سرویسهای متشابه کنار همدیگر استفاده میکنند، ولی باز هم فایلهای توصیفی جدا از هم هستند و هیچ ارتباطی با یکدیگر ندارند. در حالی که ممکن است بین وبسرویسهای مختلف و عملیات آنها ارتباط معنایی وجود داشته باشد. برای ذخیره کردن این نوع اطلاعات به استانداردهایی نیاز داریم که علاوه بر ذخیره کردن اطلاعات موجود در فایلهای توصیفی با فرمت WSDL، بتوان اطلاعات معنایی را نیز در فایلهای توصیفی با فرمت استانداردهای جدید ذخیره کرد.
شکل ۳-۷ : دید کلی از نحوهی انتشار وب سرویسها در مخازن ثبت سرویس بر اساس کلمات کلیدی و تحلیل لغوی
برای حل مشکل فوق پژوهشگران از رویکرد معناشناسی[۱۰۸] که در شاخه های دیگر علم کامپیوتر هم به کار رفته است، استفاده کردند و در این زمینه استانداردهایی را تعریف کردند که با بهره گرفتن از آنها میتوان ارتباط معنایی بین وبسرویسهای مختلف را در فایلهای توصیفی وبسرویسها با فرمت استانداردهای جدید ذخیره کرد. استانداردهایی مثل DAML-S , OWL-S ,WSDL-S , WSML برای این منظور توسعه داده شدهاند که در ادامه بعضی از آنها که در کارهای پژوهشی مورد استفاده قرار گرفتهاند، مورد بررسی قرار خواهند گرفت.
یکی از کارهای مرتبط با رویکرد معناشناسی، کار پژوهشی مورد اشاره در [۱۰] است. در راهکار ارائه شده این مقاله، برای انتشار وبسرویسها به جای اینکه از فایلهای توصیفی با فرمت سرویس wsdl در مخازن ثبت وبسرویس استفاده شود، از فایلهای توصیفی با فرمت OWL-S استفاده میشود. در ادامه نحوهی استفاده از این استاندارد معنایی در ایجاد فایلهای توصیفی و الگوریتم پیادهسازی شده در این مقاله به صورت مختصر شرح داده خواهد شد.
مزیت اصلی استاندارد معنایی OWL-S، ایجاد شبکه ای از وبسرویسها با نودها و یالهایی است که نودها در آن نشانگر وبسرویسها و یالهای موجود بین نودها، ارتباط معنایی بین وبسرویسها را نشان میدهد. در این مقاله برای محاسبه میزان تشابه ورودیها و خروجیهای عملیات مختلف از استدلال کنندهی Pellet استفاده شده است که چهار سطح تشابه مختلف را بین دو مفهوم مختلف بر میگرداند که عبارتند از :
هم ارزی[۱۰۹] :زمانی ورودی مفهوم A با خروجی مفهوم B هم ارز هستند که کاملاً یکسان باشند.
مشمول[۱۱۰] : این مقدار زمانی برگردانده میشود که ورودی مفهوم A کلیتر از خروجی مفهوم B باشد.