نحوه محاسبه آپ تایم سرور و نظارت بر آن
محاسبه آپ تایم سرور هر سازمان مدرن به شدت به سلامت شبکه و سرورهای خود وابسته است و اگر یک سرور از کار بیفتد، می تواند به طور جدی بر توانایی یک تجارت برای ارائه خدمات به مشتریان تأثیر بگذارد. اگر مدیران شبکه ندانند که یک سرور از کار افتاده است، این مشکل می تواند به سرعت بدتر شود. تا زمانی که خطوط پشتیبانی با تماس دوباره متصل نشوند، هیچ کس ممکن است متوجه وجود مشکلی نشود که در این صورت همه باید ابتدا مشکل را پیدا کرده و سپس آن را برطرف کنند. همچنین نظارت بر آپتایم میتواند از این درگیری جلوگیری کرده و تضمین کند که ارائهدهندگان خدمات شما به قراردادهای SLA خود پایبند هستند و مشتریان شما میتوانند در ۹۹.۹۹ درصد مواقع با وبسایت شما تعامل داشته باشند. در پیام هاست همراه ما باشید تا اطلاعات بیشتری در اختیارتان بگذاریم.
معیار پنج نه چیست؟
“پنج نه” به معیاری از قابلیت اطمینان یک سیستم اشاره دارد، جایی که انتظار میرود نحوه آپ تایم سرور در ۹۹.۹۹۹٪ مواقع در دسترس باشد و به درستی کار کند. این سطح از قابلیت اطمینان اغلب به عنوان استاندارد طلایی برای سیستمهای حیاتی در نظر گرفته میشود که به زمان کار تقریباً کامل نیاز دارند، مانند شبکههای مخابراتی، پلتفرمهای معاملات مالی و سیستمهای مراقبتهای بهداشتی. دستیابی به چنین معیاری، به یک زیرساخت مستحکم و redundant ، همراه با یک برنامه جامع disaster recovery نیاز دارد تا در صورت بروز هرگونه رویداد پیش بینی نشده، زمان خرابی را به حداقل برساند.
نظارت بر آپتایم سرور چیست؟
مانیتورینگ سرور میتواند به مدیران شبکه اطلاع دهد که سرور بلافاصله با مشکل مواجه میشود تا بتوانند مشکل را زودتر برطرف کنند، اما نظارت بر سرور چیست؟
چند نوع وجود دارد. اما در این مثال، نظارت بر زمان کار سرور مجموعه ای از ابزارهایی است که تضمین میکند سرورهای شما در دسترس بازدیدکنندگان قرار دارند. هشدار چنین ابزارهایی به مدیران این امکان را میدهد که از خرابی سرور در زمان محاسبه آپ تایم سرور مطلع شوند. این سرویس زمان آپ تایم سرورهای شما را نیز محاسبه می کند که آپتایم سرور معمولاً عددی از ۹۹٪ تا ۹۹.۹۹۹٪ است و نشان دهنده درصد زمانی است که سرور شما فعال است. اما تا زمانی که ندانید این عدد چگونه محاسبه میشود، دشوار است که بدانید دقیقاً چه معنایی برای کسب و کار شما دارد.
نحوه محاسبه زمان آپتایم
محاسبه آپ تایم سرور بسیار ساده است و شما تعداد ثانیه هایی را که یک سرور در یک بازه زمانی خاص از کار افتاده است را میگیرید و آن را بر تعداد کل ثانیههایی که در همان بازه زمانی روی سرور نظارت میکردید، تقسیم میکنید. نتیجهای که به دست میآورید درصد خرابی است. برای بدست آوردن درصد آپتایم، درصد خرابی را از ۱۰۰ کم کنید که این مقدار معمولاً ۹۹ درصد یا بیشتر است. اما مانیتور فقط در فواصل زمانی خاص بررسی میکند. سرور ممکن است بالا بوده و یا خراب باشد، هیچ کس واقعا نمی داند.
اگر هدف شما، نه صرفاً عددی برای نمایش دادن به مشتریان است فواصل بررسی باید کوتاه باشد. برای مثال اگر هر ۱۰ دقیقه یک بازه بررسی داشته باشید، سرور ممکن است چند ثانیه پس از بررسی از کار بیفتد. این امر باعث میشود مشتریان علاوه زمان لازم برای یافتن و رفع مشکل، تقریباً در تمام فاصله زمانی بدون خدمات باقی بمانند. با تنظیم فاصله بررسی کمتر، محاسبات زمان آپدیت دقیقتر انجام میشود و به مدیران امکان میدهد سریعتر به قطعی ها پاسخ دهند.
۳ معیار اصلی که باید ردیابی کنید عبارتند از:
- در دسترس بودن (Uptime): درصد زمانی که یک سیستم یا سرویس عملیاتی در دسترس کاربران است. با تقسیم کل زمان کار بر کل زمانی که سیستم قرار بود در دسترس باشد، محاسبه میشود.
- Mean Time Between Failures (MTBF): میانگین زمان بین دو خرابی متوالی یک سیستم یا سرویس، با تقسیم کل زمان کار بر تعداد خرابی ها محاسبه میشود.
- (MTTR) Mean Time to Repair: میانگین زمان لازم برای تعمیر یک سیستم یا سرویس خراب، با تقسیم کل خرابی بر تعداد خرابی ها محاسبه میشود.
این معیارها تصویری کلی از reliability یک سیستم ارائه کرده و به سازمانها کمک میکنند تا زمینههایی را برای بهبود شناسایی نمایند تا عملکرد و زمان بهروزرسانی سیستم خود را افزایش دهند.
فرض کنید محاسبه آپ تایم سرور خود را در طول ۱ ماه یا ۳۰ روز زیر نظر داشتید. در طی آن دوره، وب سایت شما سه قطعی را تجربه کرد که هر کدام ۳۰ دقیقه به طول انجامید و در مجموع ۹۰ دقیقه یا ۵۴۰۰ ثانیه از کار افتاد که برای محاسبه درصد زمان کار و خرابی باید از فرمول زیر استفاده کنید:
- کل زمان از کار افتادن وب سایت:
5400 ثانیه - کل زمان نظارت بر وب سایت:
2,۵۹۲,۰۰۰ ثانیه (۳۰ روز x 24 ساعت x 60 دقیقه در ۶۰ ثانیه) - درصد خرابی:
5,۴۰۰ ثانیه / ۲,۵۹۲,۰۰۰ ثانیه = 0.۰۰۲۱ = 0.۲۱٪ - درصد در دسترس بودن (Uptime):
100٪ – ۰.۲۱٪ = 99.۷۹٪ - Mean Time Between Failures (MTBF):
3 قطع / ۳۰ روز = 10 روز - Mean Time to Repair (MTTR):
3 قطع / ۹۰ دقیقه = 30 دقیقه
با استفاده از این محاسبه، می توانید reliability وب سایت یا سازمان را در مدت زمان طولانی ارزیابی کرده و تنظیمات لازم را برای بهبود عملکرد آن انجام دهید.
در مورد زمان پاسخگویی چطور؟
سرور ممکن است پاسخ دهد، اما اگر ۲۰ ثانیه طول بکشد تا یک صفحه بارگذاری شود این خوب نیست. فقط ۰.۰۵ ثانیه طول می کشد تا یک بازدیدکننده تصمیم بگیرد که آیا میخواهد پرش کند یا خیر. بنابراین محاسبه آپ تایم سرور مهم است، اما اگر سایت شما کند باشد باز هم بازدیدکنندگان خود را از دست خواهید داد. باز هم راه حل اینجا نظارت است و با نظارت بر کاربر واقعی یا RUM ، گزارشی از نحوه تعامل بازدیدکنندگان با وب سایت خودتان را دریافت میکنید.
آزمایش load میتواند به شما کمک کند تا برخی از مشکلات مربوط به زمان پاسخدهی را پیدا کنید، اما آزمایش load به شما نشان نمیدهد که این موضوع چگونه بر کاربران واقعی تأثیر میگذارد. با استفاده از RUM، میتوانید تجربه کاربر را در سایت خود اندازه گیری کرده و مناطقی را پیدا کنید که میتوانند بهبود یابند تا زمان پاسخگویی کاهش یابد و بازدیدکنندگان کمتری به سایت شما بازگردند. شما همچنین میتوانید Target Response Time SLA و Target SLA % را برای پوشش همه پایهها و اطمینان از پاسخگویی کانفیگ کنید.
اطمینان از دریافت ۹۹.۹٪ آپتایم
در حالی که میتوانید به مشتریان خود بگویید که آپتایم ۹۹٪ یا حتی ۹۹.۹۹۹٪ است، فقط تا زمانی که نتوانند به وب سایت خود دسترسی پیدا کنند، احساس خوبی در آنها ایجاد میکند. مشتریان شما انتظار دارند و به شما متکی هستند که آماده باشید. اما تا زمانی که خودتان سرورهای خود را زیر نظر نداشته باشید، واقعا نمیتوانید مطمئن باشید آنچه را که برای آن پرداخت کردهاید دریافت میکنید، یا اینکه مشتریان شما دسترسی بالایی را که شرکت شما وعده داده است دریافت میکنند.