۱:۳۲:۱۹
۱:۳۳:۳۵
۱:۳۳:۵۳
۶ MB
۵۰ GB
۵
۱:۲۸:۰۴
۱:۲۵:۴۰
۱:۲۴:۴۱
۱:۲۴:۴۶
۱:۲۴:۵۶
۱:۲۴:۱۷
۱:۲۵:۲۴
۶ MB
۵۰ GB
۶
۱:۲۱:۱۹
۱:۱۸:۲۴
۱:۱۹:۲۱
۱:۱۹:۲۵
۱:۲۰:۰۲
۱:۲۰:۴۵
۱:۱۹:۵۳
نمودار مربوط به در نشان داده شده است.
شکل ۴‑۱۰: نمودار تاثیر تعداد تکرار بر زمان پردازش
- تحلیل:
همانطور که در مشاهده می شود با افزایش تعداد تکرار داده ها سرعت پردازش ابتدا قدری افزایش و سپس کاهش می یابد. بطوریکه کمترین زمان پردازش مربوط به حالتی است که بیشترین تکرار دادهها را داریم. لذا در این بررسی، با توجه به اینکه شش نود پردازشگر داریم بهترین زمان پردازش مربوط به حالتی است که تعداد تکرار داده ها برابر با شش است. این نتیجه به این علت است که در این حالت تبادل تصاویر ورودی روی شبکه حداقل است و برای پردازش هر تصویر توسط هر ماشینی، نیازی به انتقال تصویر روی شبکه نداریم زیرا هر ماشین تمامی تصاویر را بصورت محلی روی خود در اختیار دارد.
همچنین همانطور که مشاهده می شود با در نظر گرفتن میانگین زمان پردازش ها، در حالتی که تعداد تکرار برابر با سه است شاهد بیشترین زمان پردازش هستیم و در حالتی که تکرار برابر با یک و دو است، زمان پردازش کمتر از حالتی است که تعداد تکرار برابر با سه و چهار است. این نتیجه می تواند دلایل بسیاری داشته باشد و پارامترهای زیادی و با درجه اهمیت مختلف ممکن است در این نتیجه موثر باشند. برای مثال زمانی که مستر به دنبال نزدیکترین ماشینی است که حاوی یک تصویر خاص است در حالتی که تعداد تکرار برابر با شش باشد آن داده در همهی ماشینها قرار دارد لذا نزدیکترین ماشین را یافته و یک نسخه از داده را برمیدارد. همچنین در حالتی که تعداد تکرار برابر یک است وقتی اولین نسخه از داده را یافت به دنبال نسخه دیگری نمی گردد و اگر تکرار دو باشد نیز نهایتا دو بار تلاش میکند تا دو نسخه ممکن را بیابد ولی در حالتی که تکرار ۳ یا ۴ است، نیمی از کلاستر داده را دارند و مستر مجبور است کلاستر را پیمایش کرده و نسخه های مختلف تصویر را بیابد و نزدیکترین ماشینی که داده در آن قرار دارد را تعیین کند. بنابراین تعداد تکرار تصاویر به این صورت می تواند بر حجم کاری ماشین Master و بطور کلی بر زمان پردازش تاثیر بگذارد.
علاوه براین هنگام تخصیص یک کار به یک ماشین مستر سعی می کند تا حد ممکن از ویژگی محلی بودن استفاده کند. لذا در حالت Replication=1 سعی می کند کاررا به همان ماشین بسپارد و Replication=2 سعی می کند کار را به یکی از دو ماشین بسپارد اما در حالتهایی که تعداد تکرار ۳ یا ۴ است، مستر به دنبال ماشینی است که اولا حاوی داده مربوطه باشد و ثانیا کارش تمام شده باشد تا کار را به آن بدهد. لذا ممکن است قدری اتلاف وقت داشته باشیم. لازم به ذکر است که گاهی هم داده توسط ماشینی که روی آن قرار دارد پردازش نمیشود و روی شبکه ارسال می شود تا توسط ماشین دیگری پردازش شود.
ضمنا وقتی تعداد تکرار برابر با سه است علاوه بر اینکه تصاویر ورودی باید سه بار روی کلاستر تکرار شوند، تصاویر خروجی از پردازش نیز باید سه بار روی کلاستر توزیع شوند[۱۰۰] که این عمل نیز زمانبر بوده و با ایجاد ترافیک در شبکه می تواند بر زمان پردازش تاثیر بگذارد. اما در حالت آخر با وجود اینکه که تصاویر خروجی نیز روی تمام ماشین ها ذخیره می شوند همچنان بهترین زمان پردازش را داریم و این نشان می دهد این پارامتر تاثیر کمتری بر زمان پردازش دارد. لذا میزان تاثیر عوامل مختلف بر زمان پردازش متفاوت است.
همانطور که مشاهده می شود میزان کاهش زمان پردازش در حالتی که تعداد تکرار برابر با شش است نسبت به حالتی که تعداد تکرار یک است، تقریبا ۷% است. علی رغم کاهش ۷ درصدی زمان پردازش، حجم بسیار بالایی از داده که شش برابر داده اصلی است باید روی فایل سیستم ذخیره شود. گاهی به صرفه نیست که چنین حجمی را روی دیسک ذخیره کنیم تا فقط ۷% زمان پردازش کاهش بیابد. هر چه حجم داده اصلی افزایش یابد، حجم حاصل از تکرار آن نیز افزایش یافته و حجم نتایج نیز افزایش می یابد و این مشکل بیشتر نمایان میشود. برای مثال در برنامه ای که در این پژوهش بررسی شده است به صرفه نیست GB50 داده را شش بار ذخیره کنیم تا زمان پردازش نسبت به حالتی که هر تصویر فقط یکبار ذخیره شده است، شش دقیقه سریعتر پردازش شود.
همچنین با افزایش تعداد تکرار دادهها و به تبع آن افزایش میزان دسترسی به تصاویر، نحوه تاثیر تعداد تکرار بر توان عملیاتی را نیز می توان بررسی کرد که نتیجه بررسی در نشان داده شده است. همانطور که در شکل دیده می شود میانگین تعداد تصاویر پردازش شده در هر ثانیه در بهترین حالت ۱٫۸۱ و در بدترین حالت ۱٫۵۳ است که تفاوت چندانی با هم ندارند.