برای بررسی سلامت هارد سرور و افزایش عمر مفید آن، باید از ابزارها، روشها و راهکارهای مناسبی استفاده کنید. این فرآیند شامل استفاده از نرمافزارهای تخصصی، روشهای تست دقیق، انتخاب ابزارهای مناسب و پیادهسازی راهکارهای پیشگیرانه است. اگرچه سرور و تجهیزات سرور برند hp با هر میزان هزینهای که برای خرید آن پرداخت میکنید، از ارزش خرید بالایی برخوردارند اما با این حال لازم است برای کنترل هزینهها و همینطور جلوگیری از اتلاف زمان و انرژی، سلامت قطعات را مورد بررسی قرار دهید تا عمر مفید آن افزایش پیدا کند. برای استعلام قیمت هارد سرور hp میتوانید با کارشناسان فروش ساپراصنعت در ارتباط باشید.
راهکارهای بررسی سلامت هارد سرور
-
نرمافزارهای تست هارد سرور
- HPE Smart Storage Administrator (SSA)
این ابزار اصلیترین نرمافزار مدیریت و بررسی سلامت هارد سرور وRAID Controllerها در سرور است. با استفاده از SSA میتوانید وضعیت هاردها را بررسی و پیکربندیهای RAID را مدیریت کنید. این ابزار از طریق iLO یا بوت از طریق Intelligent Provisioning در دسترس است. قابلیتهایی مانند نمایش وضعیت سلامت (مانند Healthy، Predictive Failure و …) و گزارش خطاها از ویژگیهای برجسته SSA هستند. همچنین امکان مشاهده جزئیات وضعیت SMART هاردها و بررسی پارامترهایی مانند دما، سرعت چرخش و خطاهای خواندن و نوشتن نیز فراهم است.
- HPE Insight Diagnostics
این نرمافزار برای انجام تستهای جامع و عمیق سختافزارهای سرور برند hp طراحی شده است. با استفاده از Insight Diagnostics، میتوانید تمامی قطعات سختافزاری از جمله هاردها را بهطور دقیق بررسی کنید. این ابزار تستهای زمانبندیشده، تستهای سریع و تستهای کامل را ارائه میدهد و میتواند مشکلات احتمالی را شناسایی کند و گزارش کاملی از وضعیت سلامت سیستم ارائه دهد.
- HPE iLO (Integrated Lights-Out)
iLO یک سیستم مدیریت از راه دور است که امکان مانیتورینگ سلامت کلی سرور را فراهم میکند. با استفاده از iLO میتوانید وضعیت هاردها، RAID Controllerها و سایر قطعات را از راه دور بررسی کنید. همچنین این ابزار قابلیت ارسال هشدارها به مدیر سیستم را در صورت بروز مشکلات یا خرابیها دارد. از ویژگیهای دیگر iLO میتوان به مشاهده لاگهای خطا و مدیریت بوت از راه دور اشاره کرد.
- Smart Storage Diagnostic Utility (SSDU)
SSDU یک ابزار خط فرمانی است که برای بررسی وضعیت هاردها و RAID Controllerهای hp استفاده میشود. این ابزار امکان مشاهده جزئیات دقیقتری از وضعیت SMART هاردها، پارامترهای دما، سرعت چرخش، خطاهای خواندن و نوشتن و وضعیت RAID را فراهم میکند. این ابزار بیشتر توسط مدیران سیستمهای لینوکسی استفاده میشود و باید از طریق سیستمعامل سرور نصب و اجرا شود.
-
روشهای تست سلامت هارد سرور:
-
بررسی وضعیت SMART (Self-Monitoring, Analysis, and Reporting Technology)
اکثر هاردهای سرور برند hp از فناوری SMART پشتیبانی میکنند. این فناوری پارامترهای مختلفی از سلامت هارد سرور را مانیتور میکند و در صورت بروز مشکلات احتمالی هشدار میدهد. برخی از مهمترین پارامترهای SMART عبارتند از:
- Reallocated Sectors Count: تعداد سکتورهای معیوبی که بهطور خودکار به بخشهای سالم منتقل شدهاند. افزایش این عدد نشاندهنده شروع مشکلات جدی است.
- Read Error Rate: میزان خطاهای خواندن از دیسک. افزایش این مقدار نشاندهنده خرابی هد یا مشکلات سطح دیسک است.
- Spin Retry Count: تعداد دفعات تلاش ناموفق برای چرخش دیسک. این پارامتر به مشکلات مکانیکی یا خرابی موتور اشاره دارد.
- Temperature: دمای هارد که اگر از حد مجاز تجاوز کند، عمر مفید هارد کاهش مییابد.
-
تست کامل با Insight Diagnostics
با استفاده از Insight Diagnostics میتوانید تستهای جامعی را روی هاردها اجرا کنید. این تستها شامل بررسی خواندن و نوشتن در تمامی بخشهای دیسک، تستهای زمانبندیشده و تستهای تحمل خطا هستند. این روش بهخصوص برای اطمینان از عملکرد صحیح هاردها پس از نصب یا در هنگام بروز مشکلات توصیه میشود.
-
بررسی لاگهای iLO
iLO بهطور مداوم لاگهایی از وضعیت سلامت هاردها و RAID Controllerها ثبت میکند. این لاگها شامل پیامهای خطا، هشدارها و اطلاعات مرتبط با عملکرد هاردها هستند. با بررسی این لاگها میتوانید مشکلات احتمالی را پیش از بروز خرابی جدی شناسایی کنید.
-
انواع ابزارهای تست:
-
نرمافزارهای داخلی hp
ابزارهای SSA، iLO و Insight Diagnostics که در بالا توضیح داده شدند، ابزارهای اصلی برای تست و مدیریت هارد سرور هستند.
-
نرمافزارهای شخص ثالث:
- Smartmontools:
این ابزار در سیستمعاملهای لینوکسی برای بررسی وضعیت SMART هاردها استفاده میشود و جزئیات دقیقی از پارامترهای SMART ارائه میدهد.
- HD Tune Pro وCrystalDiskInfo:
این ابزارها برای بررسی وضعیت هارد در سیستمعامل ویندوز استفاده میشوند و از قابلیتهایی مانند نمایش وضعیت SMART، تست خواندن و نوشتن و نمایش دمای هارد برخوردارند.
- SeaTools و WD Data Lifeguard:
این ابزارها بهطور اختصاصی برای هاردهای Seagate و Western Digital طراحی شدهاند و تستهای کاملی برای بررسی سلامت هاردها ارائه میدهند.
-
راهکارهای افزایش عمر هارد سرور:
-
استفاده از RAID مناسب:
استفاده از RAID مناسب میتواند تحمل خطا را افزایش دهد. RAID 1 یا RAID 5 برای امنیت بیشتر و RAID 6 یا RAID 10 برای افزایش پایداری و سرعت توصیه میشود.
-
نظارت منظم:
استفاده از iLO برای مانیتورینگ دائمی سلامت هاردها و بررسی دورهای گزارشهای SMART میتواند مشکلات را زودتر شناسایی کند.
-
محیط کاری مناسب:
نگهداری دمای دیتاسنتر بین 20-25 درجه سانتیگراد و جلوگیری از لرزشهای فیزیکی از عوامل مؤثر در افزایش عمر هاردها هستند.
-
بکاپ منظم:
علاوه بر RAID، داشتن بکاپهای منظم از دادهها ضروری است تا در صورت بروز خرابی از دست رفتن اطلاعات جلوگیری شود.
-
بهروز رسانی Firmware:
بهروز رسانی Firmware هاردها و RAID Controllerها از وبسایت HPE میتواند مشکلات نرمافزاری را برطرف کند و عملکرد سیستم را بهبود بخشد.
-
نکات تکمیلی:
- در صورت نمایش هشدار “Predictive Failure” باید هارد تعویض شود، زیرا احتمال خرابی قریبالوقوع وجود دارد.
- قبل از تعویض هارد در RAID، از سلامت RAID اطمینان حاصل کنید و اجازه دهید فرآیند Rebuild کامل شود.
- همیشه از هاردهای تأییدشده توسط HPE استفاده کنید تا از سازگاری بهتر و عملکرد پایدارتر مطمئن شوید.
در ادامه به نحوه استفاده از هر یک از نرمافزارهای اصلی بررسی سلامت هارد سرور میپردازیم. این راهنما شامل مراحل نصب، راهاندازی و اجرای تستهای سلامت هاردها با استفاده از ابزارهای زیر است:
- HPE Smart Storage Administrator (SSA)
- HPE Insight Diagnostics
- HPE iLO (Integrated Lights-Out)
- Smart Storage Diagnostic Utility (SSDU)
1. HPE Smart Storage Administrator (SSA)
الف. نحوه دسترسی به SSA
-
از طریق Intelligent Provisioning
-
- سرور را ریاستارت کنید و هنگام بوت، کلید F10 را فشار دهید تا وارد Intelligent Provisioning شوید.
- از منوی اصلی، گزینه Smart Storage Administrator را انتخاب کنید.
-
از طریق سیستمعامل:
-
- SSA را میتوانید روی سیستمعامل سرور (ویندوز یا لینوکس) نصب کنید.
- برای دانلود، به وبسایت HPE مراجعه کنید و نسخه متناسب با سیستمعامل را دانلود و نصب کنید.
ب. بررسی سلامت هاردها با SSA
- پس از ورود به SSA، کنترلرهای RAID شناساییشده نمایش داده میشوند.
- روی RAID Controller مربوطه کلیک کنید تا لیست هاردها نمایش داده شود.
- وضعیت هر هارد مانند Healthy، Predictive Failure، Failed نمایش داده میشود.
- برای مشاهده جزئیات بیشتر، روی هارد مورد نظر کلیک کنید و به بخش Drive Information بروید. در این بخش اطلاعات SMART شامل دما، خطاهای خواندن/نوشتن و وضعیت کلی سلامت نمایش داده میشود.
ج. پیکربندی RAID با SSA
- از منوی اصلی، گزینه Configure را انتخاب کنید.
- برای ساخت RAID جدید، هاردهای مورد نظر را انتخاب کنید و سپس نوع RAID مثلاً (RAID 5، RAID 1 یا RAID 6) را انتخاب کنید.
- تنظیمات را ذخیره کنید و فرآیند Initialize را آغاز کنید.
2. HPE Insight Diagnostics
الف. نحوه دسترسی به Insight Diagnostics:
-
از طریق Intelligent Provisioning
-
- سرور را ریاستارت کنید و با زدن F10 وارد Intelligent Provisioning شوید.
- از منوی Perform Maintenance، گزینه Insight Diagnostics را انتخاب کنید.
-
از طریق بوت CD یا USB
-
- میتوانید نسخه بوتیبل Insight Diagnostics را از وبسایت HPE دانلود کنید.
- پس از دانلود، فایل ISO را روی CD یا USB رایت و سرور را از طریق آن بوت کنید.
ب. انجام تست سلامت با Insight Diagnostics:
- پس از ورود، به بخش Diagnostics بروید.
- از منوی Test, هاردها را انتخاب کنید.
- میتوانید از بین Quick Test، Complete Test یا Custom Test انتخاب کنید:
- Quick Test: بررسی سریع و اولیه سلامت هاردها.
- Complete Test: تست جامع و زمانبر برای بررسی دقیق تمامی بخشهای هارد.
- Custom Test: انتخاب دستی بخشهایی که میخواهید تست شوند.
- پس از انتخاب نوع تست، Start را بزنید و منتظر بمانید تا فرآیند تکمیل شود.
- گزارش کامل تست در بخش Test Logs ذخیره میشود.
3. HPE iLO (Integrated Lights-Out)
الف. نحوه دسترسی به iLO
-
از طریق مرورگر وب:
- IP آدرس iLO را در مرورگر وارد کنید. این IP از طریق DHCP تنظیم میشود یا میتوانید بهصورت دستی در BIOS تنظیم کنید.
- با وارد کردن نام کاربری و رمز عبور (روی برچسب سرور موجود است)، وارد پنل مدیریت iLO شوید.
ب. بررسی سلامت هاردها با iLO
- پس از ورود، به بخش Information بروید و گزینه Storage را انتخاب کنید.
- وضعیت RAID Controller و تمامی هاردهای متصل نمایش داده میشود.
- وضعیت هر هارد مانند OK، Degraded، Failed نمایش داده میشود.
- برای مشاهده جزئیات بیشتر، روی هارد مورد نظر کلیک کنید تا اطلاعات SMART شامل دما، وضعیت خطاها و جزئیات بیشتر نمایش داده شود.
ج. مشاهده لاگها و دریافت هشدارها:
- از منوی اصلی، به System Information بروید و Integrated Management Log را باز کنید.
- این بخش شامل تمامی هشدارها، خطاها و پیامهای مربوط به سلامت هاردها و RAID Controllerهاست.
- برای تنظیم هشدارها، به Administration > AlertMail بروید و آدرس ایمیل خود را وارد کنید تا در صورت بروز مشکل هشدار دریافت کنید.
4. Smart Storage Diagnostic Utility (SSDU)
الف. نحوه نصب SSDU در سیستمعامل لینوکس:
- به وبسایت HPE بروید و نسخه متناسب با سیستمعامل لینوکسی خود را دانلود کنید.
- پس از دانلود، با استفاده از دستور زیر نصب کنید:
rpm -ivh hpvsa-ssdu-x.x.x.x.rpm
ب. استفاده از SSDU برای بررسی سلامت هاردها:
– برای مشاهده لیست RAID Controller ها، دستور زیر را اجرا کنید:
ssacli controller all show
- برای مشاهده وضعیت هاردها در یک RAID Controller خاص، از دستور زیر استفاده کنید:
ssacli controller slot=0 physicaldrive all show detail
در خروجی این دستور، وضعیت SMART شامل دما، خطاهای خواندن و نوشتن و وضعیت کلی سلامت نمایش داده میشود.
ج. تست سلامت هارد با SSDU :
برای انجام تست روی یک هارد خاص، از دستور زیر استفاده کنید:
ssacli controller slot=0 physicaldrive 1I:1:1 test smart
slot=0 نشاندهنده RAID Controller و 1I:1:1 آدرس فیزیکی هارد است.
پس از اتمام تست، نتیجه بهصورت PASSED یا FAILED نمایش داده میشود.
نکات تکمیلی:
- بکاپگیری قبل از تستهای جامع: قبل از انجام تستهای کامل با Insight Diagnostics یا SSDU، حتماً از دادههای مهم بکاپ بگیرید.
- بهروزرسانی Firmware: همیشه قبل از شروع تستها از بهروز بودن Firmware هاردها و RAID Controllerها اطمینان حاصل کنید. این کار را میتوانید از طریق Intelligent Provisioning یا iLO انجام دهید.
- RAID Rebuild: اگر هاردی تعویض شد، از کامل شدن فرآیند RAID Rebuild مطمئن شوید تا عملکرد صحیح RAID تضمین شود.
- نگهداری لاگها: گزارشها و لاگهای ذخیرهشده را بهطور منظم بررسی کنید و آنها را در محلی امن نگه دارید تا در صورت بروز مشکل بتوانید به آنها مراجعه کنید.
جمعبندی:
با استفاده از HPE SSA، Insight Diagnostics، iLO و SSDU میتوانید بهطور جامع سلامت هارد سرور را بررسی کنید. این ابزارها علاوه بر نمایش وضعیت سلامت، امکان اجرای تستهای دقیق و مدیریت RAID را نیز فراهم میکنند. با پیادهسازی روشهای مناسب و نظارت مستمر، میتوانید از خرابیهای ناگهانی جلوگیری کنید و عمر مفید هاردها را افزایش دهید.
بیشتر بخوانید: کاربرد اچ پی سرور در پزشکی