برای بررسی سلامت هارد سرور و افزایش عمر مفید آن، باید از ابزارها، روش‌ها و راهکارهای مناسبی استفاده کنید. این فرآیند شامل استفاده از نرم‌افزارهای تخصصی، روش‌های تست دقیق، انتخاب ابزارهای مناسب و پیاده‌سازی راهکارهای پیشگیرانه است. اگرچه سرور و تجهیزات سرور برند hp با هر میزان هزینه‌‌ای که برای خرید آن پرداخت می‌کنید، از ارزش خرید بالایی برخوردارند اما با این حال لازم است برای کنترل هزینه‌ها و همین‌طور جلوگیری از اتلاف زمان و انرژی، سلامت قطعات را مورد بررسی قرار دهید تا عمر مفید آن افزایش پیدا کند. برای استعلام قیمت هارد سرور hp می‌توانید با کارشناسان فروش ساپراصنعت در ارتباط باشید.

راهکارهای بررسی سلامت هارد سرور

  1. نرم‌افزارهای تست هارد سرور 

  • HPE Smart Storage Administrator (SSA)

این ابزار اصلی‌ترین نرم‌افزار مدیریت و بررسی سلامت هارد سرور وRAID Controllerها در سرور است. با استفاده از SSA می‌توانید وضعیت هاردها را بررسی و پیکربندی‌های RAID را مدیریت کنید. این ابزار از طریق iLO یا بوت از طریق Intelligent Provisioning در دسترس است. قابلیت‌هایی مانند نمایش وضعیت سلامت (مانند Healthy، Predictive Failure  و …)  و گزارش خطاها از ویژگی‌های برجسته SSA هستند. همچنین امکان مشاهده جزئیات وضعیت SMART هاردها و بررسی پارامترهایی مانند دما، سرعت چرخش و خطاهای خواندن و نوشتن نیز فراهم است.

  • HPE Insight Diagnostics

این نرم‌افزار برای انجام تست‌های جامع و عمیق سخت‌افزارهای سرور برند hp طراحی شده است. با استفاده از Insight Diagnostics، می‌توانید تمامی قطعات سخت‌افزاری از جمله هاردها را به‌طور دقیق بررسی کنید. این ابزار تست‌های زمان‌بندی‌شده، تست‌های سریع و تست‌های کامل را ارائه می‌دهد و می‌تواند مشکلات احتمالی را شناسایی کند و گزارش کاملی از وضعیت سلامت سیستم ارائه دهد.

  • HPE iLO (Integrated Lights-Out)

iLO یک سیستم مدیریت از راه دور است که امکان مانیتورینگ سلامت کلی سرور را فراهم می‌کند. با استفاده از iLO می‌توانید وضعیت هاردها، RAID Controllerها و سایر قطعات را از راه دور بررسی کنید. همچنین این ابزار قابلیت ارسال هشدارها به مدیر سیستم را در صورت بروز مشکلات یا خرابی‌ها دارد. از ویژگی‌های دیگر iLO می‌توان به مشاهده لاگ‌های خطا و مدیریت بوت از راه دور اشاره کرد.

  • Smart Storage Diagnostic Utility (SSDU)

SSDU یک ابزار خط فرمانی است که برای بررسی وضعیت هاردها و RAID Controllerهای hp استفاده می‌شود. این ابزار امکان مشاهده جزئیات دقیق‌تری از وضعیت SMART هاردها، پارامترهای دما، سرعت چرخش، خطاهای خواندن و نوشتن و وضعیت RAID را فراهم می‌کند. این ابزار بیشتر توسط مدیران سیستم‌های لینوکسی استفاده می‌شود و باید از طریق سیستم‌عامل سرور نصب و اجرا شود.

 

  1. روش‌های تست سلامت هارد سرور:

  • بررسی وضعیت SMART (Self-Monitoring, Analysis, and Reporting Technology)

اکثر هاردهای سرور برند hp از فناوری SMART پشتیبانی می‌کنند. این فناوری پارامترهای مختلفی از سلامت هارد سرور را مانیتور می‌کند و در صورت بروز مشکلات احتمالی هشدار می‌دهد. برخی از مهم‌ترین پارامترهای SMART عبارتند از:

  • Reallocated Sectors Count: تعداد سکتورهای معیوبی که به‌طور خودکار به بخش‌های سالم منتقل شده‌اند. افزایش این عدد نشان‌دهنده شروع مشکلات جدی است.
  • Read Error Rate: میزان خطاهای خواندن از دیسک. افزایش این مقدار نشان‌دهنده خرابی هد یا مشکلات سطح دیسک است.
  • Spin Retry Count: تعداد دفعات تلاش ناموفق برای چرخش دیسک. این پارامتر به مشکلات مکانیکی یا خرابی موتور اشاره دارد.
  • Temperature: دمای هارد که اگر از حد مجاز تجاوز کند، عمر مفید هارد کاهش می‌یابد.
  • تست کامل با Insight Diagnostics

با استفاده از Insight Diagnostics می‌توانید تست‌های جامعی را روی هاردها اجرا کنید. این تست‌ها شامل بررسی خواندن و نوشتن در تمامی بخش‌های دیسک، تست‌های زمان‌بندی‌شده و تست‌های تحمل خطا هستند. این روش به‌خصوص برای اطمینان از عملکرد صحیح هاردها پس از نصب یا در هنگام بروز مشکلات توصیه می‌شود.

  • بررسی لاگ‌های iLO

iLO به‌طور مداوم لاگ‌هایی از وضعیت سلامت هاردها و RAID Controllerها ثبت می‌کند. این لاگ‌ها شامل پیام‌های خطا، هشدارها و اطلاعات مرتبط با عملکرد هاردها هستند. با بررسی این لاگ‌ها می‌توانید مشکلات احتمالی را پیش از بروز خرابی جدی شناسایی کنید.

  1. انواع ابزارهای تست:

  • نرم‌افزارهای داخلی hp

ابزارهای SSA، iLO و Insight Diagnostics که در بالا توضیح داده شدند، ابزارهای اصلی برای تست و مدیریت هارد سرور هستند.

  • نرم‌افزارهای شخص ثالث:

  • Smartmontools:

این ابزار در سیستم‌عامل‌های لینوکسی برای بررسی وضعیت SMART هاردها استفاده می‌شود و جزئیات دقیقی از پارامترهای SMART ارائه می‌دهد.

  • HD Tune Pro  وCrystalDiskInfo:

این ابزارها برای بررسی وضعیت هارد در سیستم‌عامل ویندوز استفاده می‌شوند و از قابلیت‌هایی مانند نمایش وضعیت SMART، تست خواندن و نوشتن و نمایش دمای هارد برخوردارند.

  • SeaTools و WD Data Lifeguard:

این ابزارها به‌طور اختصاصی برای هاردهای Seagate و Western Digital طراحی شده‌اند و تست‌های کاملی برای بررسی سلامت هاردها ارائه می‌دهند.

  1. راهکارهای افزایش عمر هارد سرور:

  • استفاده از RAID مناسب:

استفاده از RAID مناسب می‌تواند تحمل خطا را افزایش دهد. RAID 1 یا RAID 5 برای امنیت بیشتر و RAID 6 یا RAID 10 برای افزایش پایداری و سرعت توصیه می‌شود.

  • نظارت منظم:

استفاده از iLO برای مانیتورینگ دائمی سلامت هاردها و بررسی دوره‌ای گزارش‌های SMART می‌تواند مشکلات را زودتر شناسایی کند.

  • محیط کاری مناسب:

نگهداری دمای دیتاسنتر بین 20-25 درجه سانتی‌گراد و جلوگیری از لرزش‌های فیزیکی از عوامل مؤثر در افزایش عمر هاردها هستند.

  • بکاپ منظم:

علاوه بر RAID، داشتن بکاپ‌های منظم از داده‌ها ضروری است تا در صورت بروز خرابی از دست رفتن اطلاعات جلوگیری شود.

  • به‌روز رسانی Firmware:

به‌روز رسانی Firmware هاردها و RAID Controllerها از وب‌سایت HPE می‌تواند مشکلات نرم‌افزاری را برطرف کند و عملکرد سیستم را بهبود بخشد.

  1. نکات تکمیلی:

  • در صورت نمایش هشدار “Predictive Failure” باید هارد تعویض شود، زیرا احتمال خرابی قریب‌الوقوع وجود دارد.
  • قبل از تعویض هارد در RAID، از سلامت RAID اطمینان حاصل کنید و اجازه دهید فرآیند Rebuild کامل شود.
  • همیشه از هاردهای تأییدشده توسط HPE استفاده کنید تا از سازگاری بهتر و عملکرد پایدارتر مطمئن شوید.

در ادامه به نحوه استفاده از هر یک از نرم‌افزارهای اصلی بررسی سلامت هارد سرور می‌پردازیم. این راهنما شامل مراحل نصب، راه‌اندازی و اجرای تست‌های سلامت هاردها با استفاده از ابزارهای زیر است:

  1. HPE Smart Storage Administrator (SSA)
  2. HPE Insight Diagnostics
  3. HPE iLO (Integrated Lights-Out)
  4. Smart Storage Diagnostic Utility (SSDU)

1. HPE Smart Storage Administrator (SSA)

 

الف. نحوه دسترسی به SSA

  1. از طریق Intelligent Provisioning
    • سرور را ری‌استارت کنید و هنگام بوت، کلید F10 را فشار دهید تا وارد Intelligent Provisioning شوید.
    • از منوی اصلی، گزینه  Smart Storage Administrator را انتخاب کنید.
  1. از طریق سیستم‌عامل:
    • SSA را می‌توانید روی سیستم‌عامل سرور (ویندوز یا لینوکس) نصب کنید.
    • برای دانلود، به وب‌سایت HPE مراجعه کنید و نسخه متناسب با سیستم‌عامل را دانلود و نصب کنید.

ب. بررسی سلامت هاردها با SSA

  • پس از ورود به SSA، کنترلرهای RAID شناسایی‌شده نمایش داده می‌شوند.
  • روی RAID Controller مربوطه کلیک کنید تا لیست هاردها نمایش داده شود.
  • وضعیت هر هارد مانند Healthy، Predictive Failure، Failed نمایش داده می‌شود.
  • برای مشاهده جزئیات بیشتر، روی هارد مورد نظر کلیک کنید و به بخش Drive Information بروید. در این بخش اطلاعات SMART شامل دما، خطاهای خواندن/نوشتن و وضعیت کلی سلامت نمایش داده می‌شود.

ج. پیکربندی RAID با SSA

  • از منوی اصلی، گزینه Configure  را انتخاب کنید.
  • برای ساخت RAID جدید، هاردهای مورد نظر را انتخاب کنید و سپس نوع RAID مثلاً (RAID 5، RAID 1 یا RAID 6) را انتخاب کنید.
  • تنظیمات را ذخیره کنید و فرآیند Initialize  را آغاز کنید.

2. HPE Insight Diagnostics

 

الف. نحوه دسترسی به Insight Diagnostics:

  1. از طریق Intelligent Provisioning
    • سرور را ری‌استارت کنید و با زدن F10 وارد Intelligent Provisioning شوید.
    • از منوی Perform Maintenance، گزینه Insight Diagnostics  را انتخاب کنید.
  1. از طریق بوت CD یا USB
    • می‌توانید نسخه بوتیبل Insight Diagnostics را از وب‌سایت HPE دانلود کنید.
    • پس از دانلود، فایل ISO را روی CD یا USB رایت و سرور را از طریق آن بوت کنید.

ب. انجام تست سلامت با Insight Diagnostics:

  • پس از ورود، به بخش Diagnostics بروید.
  • از منوی Test, هاردها را انتخاب کنید.
  • می‌توانید از بین Quick Test، Complete Test  یا Custom Test انتخاب کنید:
    • Quick Test: بررسی سریع و اولیه سلامت هاردها.
    • Complete Test: تست جامع و زمان‌بر برای بررسی دقیق تمامی بخش‌های هارد.
    • Custom Test: انتخاب دستی بخش‌هایی که می‌خواهید تست شوند.
  • پس از انتخاب نوع تست، Start  را بزنید و منتظر بمانید تا فرآیند تکمیل شود.
  • گزارش کامل تست در بخش Test Logs ذخیره می‌شود.

3. HPE iLO (Integrated Lights-Out)

 

الف. نحوه دسترسی به iLO

  1. از طریق مرورگر وب:
    • IP  آدرس iLO را در مرورگر وارد کنید. این IP از طریق DHCP تنظیم می‌شود یا می‌توانید به‌صورت دستی در BIOS  تنظیم کنید.
    • با وارد کردن نام کاربری و رمز عبور (روی برچسب سرور موجود است)، وارد پنل مدیریت iLO شوید.

ب. بررسی سلامت هاردها با iLO

  • پس از ورود، به بخش Information  بروید و گزینه Storage را انتخاب کنید.
  • وضعیت RAID Controller و تمامی هاردهای متصل نمایش داده می‌شود.
  • وضعیت هر هارد مانند OK، Degraded، Failed نمایش داده می‌شود.
  • برای مشاهده جزئیات بیشتر، روی هارد مورد نظر کلیک کنید تا اطلاعات SMART شامل دما، وضعیت خطاها و جزئیات بیشتر نمایش داده شود.

ج. مشاهده لاگ‌ها و دریافت هشدارها:

  • از منوی اصلی، به System Information بروید و Integrated Management Log را باز کنید.
  • این بخش شامل تمامی هشدارها، خطاها و پیام‌های مربوط به سلامت هاردها و RAID Controllerهاست.
  • برای تنظیم هشدارها، به Administration > AlertMail بروید و آدرس ایمیل خود را وارد کنید تا در صورت بروز مشکل هشدار دریافت کنید.

4.  Smart Storage Diagnostic Utility (SSDU)

الف. نحوه نصب SSDU در سیستم‌عامل لینوکس:

  • به وب‌سایت HPE بروید و نسخه متناسب با سیستم‌عامل لینوکسی خود را دانلود کنید.
  • پس از دانلود، با استفاده از دستور زیر نصب کنید:

rpm -ivh hpvsa-ssdu-x.x.x.x.rpm

ب. استفاده از SSDU برای بررسی سلامت هاردها:

      – برای مشاهده لیست RAID Controller ها، دستور زیر را اجرا کنید:

ssacli controller all show

  • برای مشاهده وضعیت هاردها در یک RAID Controller خاص، از دستور زیر استفاده کنید:

ssacli controller slot=0 physicaldrive all show detail

در خروجی این دستور، وضعیت SMART شامل دما، خطاهای خواندن و نوشتن و وضعیت کلی سلامت نمایش داده می‌شود.

ج. تست سلامت هارد با SSDU :

برای انجام تست روی یک هارد خاص، از دستور زیر استفاده کنید:

ssacli controller slot=0 physicaldrive 1I:1:1 test smart

slot=0 نشان‌دهنده RAID Controller و 1I:1:1 آدرس فیزیکی هارد است.

پس از اتمام تست، نتیجه به‌صورت PASSED یا FAILED نمایش داده می‌شود.

نکات تکمیلی:

  • بکاپ‌گیری قبل از تست‌های جامع: قبل از انجام تست‌های کامل با Insight Diagnostics یا SSDU، حتماً از داده‌های مهم بکاپ بگیرید.
  • به‌روزرسانی Firmware: همیشه قبل از شروع تست‌ها از به‌روز بودن Firmware هاردها و RAID Controllerها اطمینان حاصل کنید. این کار را می‌توانید از طریق Intelligent Provisioning یا iLO انجام دهید.
  • RAID Rebuild:  اگر هاردی تعویض شد، از کامل شدن فرآیند RAID Rebuild مطمئن شوید تا عملکرد صحیح RAID تضمین شود.
  • نگهداری لاگ‌ها: گزارش‌ها و لاگ‌های ذخیره‌شده را به‌طور منظم بررسی کنید و آن‌ها را در محلی امن نگه دارید تا در صورت بروز مشکل بتوانید به آن‌ها مراجعه کنید.

جمع‌بندی:

با استفاده از HPE SSA، Insight Diagnostics، iLO و SSDU می‌توانید به‌طور جامع سلامت هارد سرور را بررسی کنید. این ابزارها علاوه بر نمایش وضعیت سلامت، امکان اجرای تست‌های دقیق و مدیریت RAID را نیز فراهم می‌کنند. با پیاده‌سازی روش‌های مناسب و نظارت مستمر، می‌توانید از خرابی‌های ناگهانی جلوگیری کنید و عمر مفید هاردها را افزایش دهید.

 

بیش‌تر بخوانید: کاربرد اچ پی سرور در پزشکی