موزه ملي علوم و فناوري

محاسبه Availability قبل از انتخاب سرور

۲۲ شهریور ۱۳۹۶

برای اینکه بتوانیم انتخاب سرور مناسب سازمان و شرکت خود را انجام داده و سرور مناسبی خریداری کنیم، ابتدا باید به یک سری سوالات اساسی پاسخی دهیم. اینکه این سرور در سازمان و شرکت من چه نقشی دارد، اولین و مهمترین سوالی است که باید پاسخ دهید. همان طور که می‌دانیم، اپلیکیشن‌هایی که روی این سرور اجرا می‌شوند، انواع و اهمیت متفاوتی دارند. تعیین نقش سرور و تعیین این اپلیکیشن‌ها اهمیت فراوانی در انتخاب سروری که خریداری می‌کنیم دارد.

سرویس‌ها و اپلیکیشن‌هایی که در سرور و شبکه ارائه می‌شوند، به سه دسته تقسیم می‌شوند:

  1. Mission Critical: اپلیکیشن‌هایی هستند که حتی یک ثانیه قطع شدن آنها، باعث ضرر مالی و جانی در کشور می‌شود. پس باید دسترس‌پذیری صد دموزه ملیی داشته باشد. درنتیجه Availability و Downtime مهم است، ولی بودجه مهم نیست.
  2. Business Critical: اپلیکیشن‌هایی که قطع شدن آنها، باعث ضرر مالی برای یک سازمان می‌شود. مثلا قطعی سایت، CRM، سرور تراکنش آنلاین بانک، وب سرور دیجیکالا. سرویس بانک‌ها، سرویس اینترنت. پس سطح بالای Availability احتیاج دارند اما می‌توانند قطعی داشته باشند و میزان خیلی کمی Downtime برای آنها قابل قبول است.
  3. Non-Critical (Archiving): سرور DHCP، AD، وایرلس، پرینت و فایل سرور، ضبط تصاویر مدار بسته.

Availability چیست؟
معمولا Availability را به صورت ۳ تا ۹ یا ۶ تا ۹ بیان می‌کنند:

اگر دسترس‌پذیری ۶ تا ۹ یعنی ۹۹٫۹۹۹۹% باشد، در طول سال تنها ۳۱ ثانیه Downtime را تجربه می‌کنید که این مساله برای اپلیکشین‌های Mission Critical ایده‌آل و ضروری است. به ۶ تا ۹ نمی‌رسیم مگر اینکه دو تا سایت داشته باشیم. اگر به ۵ تا ۹ و یا ۶ تا ۹ دست یابیم در واقع به High Availability دست یافته‌ایم.

اگر ۳ تا ۹ یعنی ۹۹٫۹% داشته باشیم، در طول سال، ۸٫۷۶ ساعت، تجربه Downtime و قطعی را خواهیم داشت.

موارد تاثیرگذار بر Uptime و Downtime
مهمترین عناصری که بر Uptime و Downtime اثر دارد موارد زیر هستند:

۱٫     MTBF (Mean Time Between Failure)
2.     MTTR (Mean Time To Repair)
3.     Impacted User Minates (IUM)
4.     Defects per Million (DPM)
5.     Performance (e.g latency, drop)

فرمول زیر ساد‌ترین فرمول برای محاسبه Uptime و Availability است:

Availability (%) = MTBF / (MTBF + MTTR)

MTBF مدت زمانی است که قطعه‌ای کار می‌کند تا خراب شود. میزان آن را شرکت سازنده اعلام می‌کند و واحد آن ساعت است.
MTTR زمانی است که طول می‌کشد تا قطعه خراب را تعمیر یا تعویض کنیم.
به عنوان مثال اگر رمی داریم که MTBF آن برابر با ۲۰۰۰۰۰ است. از این رم به تعداد ۲۰ عدد در دیتاسنتر استفاده می‌شود. پس MTBF در کل دیتاسنتر برای قطعه رم می‌شود ۱۰۰۰۰:

MTBF = 200,000 / 20 = 10,000

MTBF برابر با ده هزار ساعت است. اگر MTTR  برابر با ۲ ساعت باشد، Availability چقدر می‌شود؟

Availability (%) = 10000 / (10000 + 2) = 99.99% 

پس طبق جدول بالا، Downtime در طول یک سال، ۵۲ دقیقه است. برای تمامی قطعات باید Availability را محاسبه کنیم و در نهایت کمترین A، می‌شود میزان Availability در کل دیتاسنتر.

 

شرکت فالنیک (Iran hp) حامی بخش شبکه در شبکه