PCIe ، شریان حیاتی دیتاسنتر

گذرگاه PCI Express (Peripheral Component Interconnect Express) شریان حیاتی هر سرور و ورک‌استیشن مدرن است. این گذرگاه وظیفه اتصال پرسرعت پردازنده مرکزی (CPU) به تمام اجزای مهم جانبی (Peripherals) از جمله کارت‌های شبکه، کنترلرهای ذخیره‌سازی، درایوهای NVMe و مهم‌تر از همه، پردازنده‌های گرافیکی (GPU) را بر عهده دارد. در محیط‌های دیتاسنتر که هر میکروثانیه اهمیت دارد، پهنای باند و تأخیر (Latency) گذرگاه PCIe به طور مستقیم بر عملکرد کل سیستم تأثیر می‌گذارد. به همین دلیل، هنگام بررسی قیمت سرور اچ پی، هزینه قطعات سرور مانند GPUها یا NVMeهای پرسرعت، ارتباط مستقیمی با پشتیبانی سرور از جدیدترین نسل‌های PCIe دارد. درک تفاوت میان نسل‌های مختلف PCIe، کلید طراحی یک زیرساخت مقیاس‌پذیر و آماده برای پذیرش Workloadهای آینده مانند هوش مصنوعی و تحلیل کلان داده است.

نسل‌های PCIe و قانون دو برابر شدن پهنای باند

تکامل PCIe با هدف مستمر دو برابر کردن پهنای باند (Throughput) در هر نسل، نسبت به نسل قبلی، صورت گرفته است. این امر تضمین می‌کند که سرعت پیشرفت CPUها و GPUها دچار گلوگاه نشود.

۱. مکانیزم محاسبه سرعت و پهنای باند

سرعت انتقال داده در PCIe با دو معیار کلیدی اندازه‌گیری می‌شود:

  • نرخ انتقال (Transfer Rate – GT/s): این معیار تعداد گیگا انتقال در ثانیه را نشان می‌دهد و شامل بیت‌های داده واقعی و بیت‌های سربار (Overhead) پروتکل است.
  • پهنای باند (Bandwidth – GB/s): این معیار مقدار داده مفید قابل انتقال در ثانیه را نشان می‌دهد و بر اساس فرمول:

{پهنای باند} = نرخ انتقال (GT/s) x تعداد Lane x راندمان رمزگذاری

در نسل‌های PCIe Gen1 تا Gen3، راندمان رمزگذاری ٪۸۰ بود (رمزگذاری 8b/10b). یعنی از هر ۱۰ بیت ارسال شده، فقط ۸ بیت داده مفید بود. اما با شروع PCIe Gen 4، راندمان با استفاده از رمزگذاری 128b/130b به بیش از ٪۹۸ افزایش یافت که این جهش بزرگی در بهره‌وری سیگنال‌دهی ایجاد کرد.

۲. مقایسه سرعت PCIe نسل‌های کلیدی (در یک Lane)

نسل PCIe نرخ انتقال (GT/s) پهنای باند در یک Lane (GB/s) راندمان رمزگذاری
Gen 3 ۸.۰ ۰.۹۸۵ 8b/10b (%80)
Gen 4 ۱۶.۰ ۱.۹۷ 128b/130b (%98.5)
Gen 5 ۳۲.۰ ۳.۹۴ 128b/130b (%98.5)
Gen 6 ۶۴.۰ ۷.۸۷ PAM4 (%98.5)
Gen 7 ۱۲۸.۰ ۱۵.۷۵ PAM4 (%98.5)

۳. مفهوم Lane و اسلات (x1، x8، x16)

پهنای باند کلی گذرگاه PCIe با تعداد Laneها (خطوط انتقال موازی) تعیین می‌شود.

  • x16: اسلاتی که از ۱۶ خط انتقال به صورت همزمان استفاده می‌کند. این بالاترین پیکربندی است و معمولاً برای کارت‌های گرافیک یا آداپتورهای شبکه ۴۰۰G در نظر گرفته می‌شود.
  • x8: اسلاتی که از ۸ خط استفاده می‌کند، رایج برای کارت‌های شبکه ۲۰۰G یا کنترلرهای RAID پرسرعت.
  • x4: رایج برای درایوهای NVMe M.2 و برخی کارت‌های شبکه ۱۰۰G.

 

مکانیزم محاسبه پهنای باند و نمایش Lane

 

به عنوان مثال، پهنای باند یک اسلات x16 در نسل ۵، 3.94GB/s x 16 یعنی حدودا 63 گیگابایت بر ثانیه است.

اهمیت این موضوع زمانی مشخص می‌شود که یک کارت شبکه ۴۰۰ گیگابیت بر ثانیه (Gbps) به پهنای باندی در حدود ۵۰ گیگابایت بر ثانیه (GB/s) نیاز دارد. این کارت برای کارکرد با راندمان کامل، نیازمند یک اسلات PCIe Gen 5 x16 است. اگر همین کارت روی PCIe Gen 4 x16 نصب شود، پهنای باند به نصف کاهش یافته و عملکرد کارت شبکه دچار گلوگاه (Bottleneck) جدی می‌شود.

ویژگی‌های کلیدی PCIe نسل‌های ۵، ۶ و ۷

فراتر از افزایش صرف سرعت، هر نسل ویژگی‌های نوینی را برای افزایش کارایی و پاسخگویی به نیازهای جدید دیتاسنتر معرفی می‌کند.

۱. PCIe Gen 5: استاندارد فعلی سرورهای رده‌بالا

  • نقطه عطف: اولین استاندارد ۳۲ GT/s است که پهنای باند ۶۴ گیگابایت بر ثانیه را در x16 فراهم می‌کند.
  • کاربرد حیاتی: این نسل برای پشتیبانی از نسل‌های جدید درایوهای NVMe Gen 5 که قادر به ارائه سرعت خواندن ۱۴ تا ۱۶ گیگابایت بر ثانیه هستند، ضروری است. همچنین برای تغذیه GPUهای آموزشی با حجم داده بالا، حیاتی است.

یکی از مهم‌ترین ویژگی‌های Gen 5، بهبود پروتکل برای سناریوهای Multi-Host است. در این نسل، کنترلر PCIe با قابلیت‌های پیشرفته‌تر QoS (Quality of Service) و End-to-End Reliability ارائه می‌شود که برای محیط‌های مجازی‌سازی با تراکم بالا و همچنین معماری‌هایی که از CXL (Compute Express Link) استفاده می‌کنند، یکپارچگی سیگنال و داده‌ها را تضمین می‌کند.

۲. PCIe Gen 6 و جهش به سمت PAM4 و Latency پایین

  • تکنولوژی کلیدی: سیگنال‌دهی PAM4 (Pulse Amplitude Modulation 4-Level).

PAM4 به جای انتقال یک بیت در هر چرخه (مانند سیگنال‌دهی NRZ در Gen 5)، دو بیت را در هر چرخه انتقال می‌دهد. این امر، بدون نیاز به دو برابر کردن فرکانس سیگنال، پهنای باند را دو برابر می‌کند. این تغییر باعث می‌شود Gen 6 برای معماری‌های جدید CXL (Compute Express Link) که نیازمند تأخیر بسیار پایین برای دسترسی به حافظه مشترک هستند، ایده‌آل باشد.

  • مکانیزم تصحیح خطا (FEC): برای مدیریت خطاهایی که به طور ذاتی در سیگنال‌دهی PAM4 وجود دارند، Gen 6 از Forward Error Correction (FEC) سبک استفاده می‌کند. این مکانیزم تضمین می‌کند که سرعت انتقال افزایش یابد در حالی که نرخ خطای بیت (BER) در محدوده قابل قبول باقی بماند. این یک تغییر عمده نسبت به نسل‌های قبل است.

۳. PCIe Gen 7 و آینده محاسبات پر سرعت (پیش‌بینی شده)

  • هدف: دستیابی به نرخ انتقال ۱۲۸ GT/s، معادل ۱۲۸ گیگابایت بر ثانیه در یک اسلات x8 و ۲۵۶ گیگابایت بر ثانیه در یک اسلات x16.
  • کاربرد مورد انتظار: این نسل برای پشتیبانی از شبکه‌های ۸۰۰G و ۱۶۰۰G و همچنین ارتباطات Multi-GPU در مقیاس بسیار بزرگ (برای هوش مصنوعی مولد) که نیازمند تبادل حجم عظیمی از داده با کمترین تأخیر هستند، طراحی خواهد شد.

Gen 7 احتمالاً بر بهبود بیشتر کارایی انرژی و کاهش پیچیدگی و هزینه کابل‌کشی در فواصل کوتاه تمرکز خواهد کرد. این سطح از پهنای باند، امکان ایجاد یک Fabric (شبکه داخلی) برای اتصال مستقیم ده‌ها GPU و NVMe را فراهم می‌کند و وابستگی به معماری‌های سنتی CPU-Centric را کاهش می‌دهد.

 

مقایسه سیگنال‌دهی NRZ در مقابل PAM4

 

 

چالش‌های پیاده‌سازی و ملاحظات سروری

اگرچه افزایش پهنای باند یک مزیت بزرگ است، پیاده‌سازی آن در محیط سرورهای رک‌مونت چالش‌های متعددی را به همراه دارد.

۱. چالش‌های سیگنال‌دهی و سخت‌افزاری

  • افت سیگنال (Signal Degradation): در فرکانس‌های بالاتر (مانند ۳۲ GT/s در Gen 5 و بالاتر)، سیگنال الکتریکی در طول مسیرهای طولانی (مثل مسیر بین CPU و اسلات PCIe روی رایزر کارت) به سرعت کیفیت خود را از دست می‌دهد.

برای غلبه بر این مشکل، سرورهای مدرن از تکنیک‌هایی مانند Re-timers و Re-drivers استفاده می‌کنند. Re-drivers سیگنال را تقویت کرده و Re-timers سیگنال را قبل از ارسال مجدد، بازسازی می‌کنند تا از صحت آن در سراسر کانال PCIe اطمینان حاصل شود. این قطعات در مسیرهای طولانی گذرگاه و روی رایزر کارت‌ها ضروری هستند. کیفیت مواد PCB (Board Material) در مادربردها و رایزر کارت‌های Gen 5 باید به مراتب بالاتر (مانند مواد Low-Loss) باشد تا افت سیگنال به حداقل برسد.

 

چالش یکپارچگی سیگنال PCIe و راه‌حل تراشه Re-timer

 

۲. مدیریت حرارتی و توان (Power and Thermal Management)

  • مصرف برق: با افزایش سرعت، مصرف برق تراشه‌های کنترلر PCIe و همچنین کارت‌های توسعه‌ای که از این پهنای باند استفاده می‌کنند (مانند GPUها)، به شدت افزایش می‌یابد.
  • خنک‌کنندگی: سرور باید سیستم خنک‌کننده قوی‌تری داشته باشد تا بتواند گرمای تولید شده توسط مسیرهای پرسرعت و کارت‌های پرمصرف را مدیریت کند.

استاندارد PCIe توان مصرفی هر اسلات (Slot Power) را تعریف می‌کند. با این حال، کارت‌های Gen 5 و بالاتر، اغلب نیاز به توان بیشتری از اسلات‌های خود دارند، که مدیریت آن از طریق پین‌های برق کمکی (Auxiliary Power Pins) روی مادربرد یا رایزر کارت‌ها انجام می‌شود. سیستم‌های مدیریت سرور (مانند HPE iLO) توان مصرفی PCIe را به طور دقیق پایش می‌کنند و در صورت مصرف بیش از حد یا افزایش دمای غیرمجاز، می‌توانند Power Throttling را فعال کنند.

۳. تخصیص انعطاف‌پذیر Laneها

در سرورهای سازمانی، تخصیص Laneهای PCIe دیگر ثابت نیست و به صورت پویا مدیریت می‌شود.

  • Bifurcation: بایوس (BIOS) سرور می‌تواند Laneهای یک اسلات x16 را تقسیم (Bifurcate) کند (مثلاً به دو اسلات x8 یا چهار اسلات x4) تا بتواند دو NVMe یا چند کارت شبکه را روی یک اسلات فیزیکی نصب کرد.
  • وابستگی به CPU: تعداد کل Laneهای PCIe قابل استفاده مستقیماً به مدل CPU (Intel Xeon/AMD EPYC) و پشتیبانی مادربرد بستگی دارد. حداکثر تعداد Laneها بین CPU و چیپ‌ست، تعیین‌کننده اصلی ظرفیت توسعه پذیری سرور است.

جدیدترین معماری‌ها از Dynamic Lane Bifurcation پشتیبانی می‌کنند که می‌تواند بر اساس نیاز Workload در لحظه، تخصیص Lane را تغییر دهد. همچنین، مفهوم PCIe Hot-Plug اهمیت بیشتری پیدا می‌کند؛ به این معنا که کارت‌های توسعه می‌توانند بدون نیاز به خاموش شدن سیستم، اضافه یا حذف شوند، و این فرآیند توسط مدیریت Laneهای PCIe در سطح نرم‌افزار (OS) و سخت‌افزار (Chipset) پشتیبانی می‌شود.

 

تقسیم‌بندی PCIe و تخصیص انعطاف‌پذیر Lane برای NVMe

 

خلاصه و نتیجه‌گیری

تکامل گذرگاه PCIe از Gen 3 تا Gen 7 نه تنها یک روند خطی افزایش سرعت نیست، بلکه یک تحول مهندسی است که پایداری، راندمان سیگنال‌دهی و مدیریت توان را بهبود بخشیده است. مهاجرت به PCIe Gen 5 و بالاتر برای هر سازمان که قصد پیاده‌سازی Workloadهای AI Training، حافظه فلش پرسرعت (NVMe) یا شبکه‌بندی ۴۰۰G/۸۰۰G را دارد، ضروری است. در غیر این صورت، کارت‌های گران‌قیمت پرسرعت دچار گلوگاه پهنای باند خواهند شد.
در نهایت، موفقیت در به کارگیری جدیدترین نسل‌های PCIe به انتخاب سخت‌افزار مناسب (سرور، CPU و کارت‌های توسعه) و همچنین استفاده از قطعات با کیفیت (مانند رایزر کارت‌ها و کابل‌های پرسرعت) بستگی دارد. ساپراصنعت با تمرکز بر این جزئیات فنی دقیق، اطمینان می‌دهد که زیرساخت‌های سروری که تأمین می‌کند، به طور کامل از توان عملیاتی مورد نیاز شما برای سال‌های آینده پشتیبانی می‌کنند.