همه دسته‌بندی‌ها

دریافت نقل‌قول رایگان

نماینده ما به زودی با شما تماس خواهد گرفت.
ایمیل
نام
نام شرکت
پیام
0/1000

چگونه منبع تغذیه خنک‌کننده غوطه‌ور برای هوش مصنوعی با عملکرد بالا را انتخاب کنیم

2026-05-02 14:36:00
چگونه منبع تغذیه خنک‌کننده غوطه‌ور برای هوش مصنوعی با عملکرد بالا را انتخاب کنیم

انتخاب منبع تغذیهٔ مناسب با سیستم خنک‌کنندگی غوطه‌ور برای زیرساخت‌های هوش مصنوعی با عملکرد بالا، نیازمند درک جامعی از هر دو دینامیک مدیریت حرارتی و ویژگی‌های عملکردی الکتریکی است. با اینکه بارهای کاری هوش مصنوعی به‌طور فزاینده‌ای مرزهای محاسباتی را گسترش می‌دهند، سیستم‌های تأمین توان سنتی مبتنی بر خنک‌کنندگی هوا به‌طور فزاینده‌ای در پاسخ به نیازهای آرایه‌های فشردهٔ پردازنده‌ها و محیط‌های محاسباتی شتاب‌دار دچار مشکل می‌شوند. ادغام فناوری خنک‌کنندگی غوطه‌ور، نحوه طراحی، مشخص‌سازی و راه‌اندازی منابع تغذیه در مراکز داده هوش مصنوعی و امکانات محاسبات لبه‌ای را اساساً تغییر می‌دهد.

immersion cooling power supply

فرآیند انتخاب منبع تغذیه‌ای برای خنک‌کنندگی غوطه‌ور فراتر از محاسبات ساده توان و رتبه‌بندی‌های بازده، شامل سازگان حرارتی، واکنش با مایع دی‌الکتریک، نیازمندی‌های درزبندی اتصال‌دهنده‌ها و قابلیت اطمینان عملیاتی در شرایط غوطه‌وری می‌شود. مهندسانی که مسئول پیاده‌سازی سیستم‌های هوش مصنوعی در محیط‌های غوطه‌ور هستند، باید معماری‌های منبع تغذیه را ارزیابی کنند که ضمن حفظ تمامیت عملکرد، با محیط‌های خنک‌کننده مایع که مستقیماً با اجزای الکترونیکی تماس دارند، تعامل مناسبی داشته باشند. این فرآیند تصمیم‌گیری شامل تعادل‌بخشی بین مشخصات فنی، صرفه‌جویی در هزینه کل مالکیت، بهبود بازده حرارتی و نیازمندی‌های نگهداری بلندمدت خاص محیط‌های محاسباتی غوطه‌ور است.

درک معماری منبع تغذیه خنک‌کنندگی غوطه‌ور برای بارهای کاری هوش مصنوعی

تفاوت‌های اساسی طراحی نسبت به منابع تغذیه سنتی

منبع تغذیه با سیستم خنک‌کنندگی غوطه‌وری از نظر استراتژی دفع حرارت و رویکرد حفاظت از اجزا به‌طور اساسی با واحدهای خنک‌شونده با هوا متفاوت است. به‌جای اتکا به جابه‌جایی اجباری هوا از طریق صفحات گرمایی (هیت‌سینک‌ها) و فن‌ها، این منابع تغذیه تخصصی یا درون خود مایع دی‌الکتریک غوطه‌ور عمل می‌کنند یا از طریق اتصالات دربسته به سیستم‌های خنک‌شونده غوطه‌وری متصل می‌شوند. حذف فن‌های فعال خنک‌کننده، نقاط شکست مکانیکی را کاهش می‌دهد، در حالی که اتصال مستقیم حرارتی با مایع خنک‌کننده امکان عملکرد پایدار با توان بالا را در دمای اتصالی (جوکشن) پایین‌تر اجزا فراهم می‌سازد. طراحان منابع تغذیه باید ویژگی‌های رسانایی حرارتی مایعات دی‌الکتریک را در نظر بگیرند که معمولاً از روغن‌های معدنی تا فلوروکربن‌های مهندسی‌شده متغیر است و هر یک ضرایب انتقال حرارت و خواص عایقی الکتریکی متمایزی دارند.

توپولوژی الکتریکی یک منبع تغذیه خنک‌کننده با غوطه‌وری باید قادر به سازگاری با محیط الکتریکی منحصربه‌فردی باشد که توسط غوطه‌وری در مایعات دی‌الکتریک ایجاد می‌شود. انتخاب اجزا بر روی مواد و پوشش‌دهنده‌هایی تمرکز دارد که با قرارگیری طولانی‌مدت در معرض این مایعات سازگار هستند و از تخریب سیستم‌های عایقی و یکپارچگی اتصالات لحیم‌کاری جلوگیری می‌کنند. هسته‌های ترانسفورماتور، دی‌الکتریک‌های خازن‌ها و بسته‌بندی نیمه‌هادی‌ها نیازمند صلاحیت‌یابی برای استفاده در شرایط غوطه‌وری هستند، زیرا اجزای استاندارد ممکن است در معرض مداوم مایعات خنک‌کننده، پیری شتاب‌یافته یا انحراف عملکردی را تجربه کنند. مراحل تبدیل توان معمولاً از تنوع‌های توپولوژیکی بهره می‌برند که برای قابلیت‌های بهبودیافته مدیریت حرارتی بهینه‌سازی شده‌اند و این امر امکان استفاده از فرکانس‌های سوئیچینگ و چگالی توان بالاتری را نسبت به معادل‌های خنک‌شونده با هوا فراهم می‌کند.

نیازمندی‌های تأمین ولتاژ و جریان برای واحدهای پردازش هوش مصنوعی

شتاب‌دهنده‌های هوش مصنوعی با عملکرد بالا نیازمند تنظیم دقیق ولتاژ با ریپل خروجی بسیار کم و قابلیت پاسخگویی سریع در برابر تغییرات ناگهانی بار هستند. پردازنده‌های مدرن شبکه عصبی در ولتاژهای هسته‌ای زیر یک ولت کار می‌کنند، در حالی که در طول ضربه‌های محاسباتی، جریان‌های لحظه‌ای بیش از صدها آمپر را مصرف می‌کنند. منبع تغذیه‌ای که برای این بارها از روش خنک‌کنندگی غوطه‌وری استفاده می‌کند، باید ریل‌های ولتاژی با تنظیم بسیار دقیق (با دقتی در سطح میلی‌ولت) را در برابر تغییرات باری که نرخ تغییرشان از یک آمپر در نانوثانیه فراتر می‌رود، تأمین کند. معماری توزیع توان باید امپدانس بین خروجی منبع تغذیه و پین‌های تغذیه پردازنده را به حداقل برساند؛ که اغلب مستلزم قرار دادن مراحل تبدیل توان در نقطه مصرف (Point-of-Load) به‌صورت توزیع‌شده درون تانک خنک‌کنندگی غوطه‌وری است.

ظرفیت تحویل فعلی منبع تغذیه با خنک‌کنندگی غوطه‌وری، به‌طور مستقیم تعیین‌کننده چگالی محاسباتی قابل دستیابی در حجم معینی از مخزن خنک‌کننده است. خوشه‌های آموزش هوش مصنوعی اغلب چندین کارت پردازنده را در حمام‌های غوطه‌وری مشترک تجمع می‌دهند که منجر به ایجاد تقاضاهای توان تجمعی از ده‌ها تا صدها کیلووات در هر مخزن می‌شود. انتخاب منبع تغذیه نه‌تنها باید بر اساس توان تحویل در حالت پایدار باشد، بلکه باید احتمال آماری وقوع همزمان بار اوج در چندین پردازنده نیز در نظر گرفته شود. مشخص‌سازی صحیح نیازمند تحلیل دقیق نمودارهای توان بار کاری است، از جمله عوامل متوسط بهره‌برداری، ویژگی‌های مدت زمان پالس‌های اوج و همبستگی بین وظایف پردازش موازی که بر الگوهای تقاضای جریان تجمعی تأثیر می‌گذارند.

ملاحظات رابط حرارتی بین سیستم تغذیه و سیستم خنک‌کننده

رابط حرارتی بین منبع تغذیهٔ خنک‌کننده با غوطه‌وری و مایع دی‌الکتریک، مرزی حیاتی از نظر عملکرد است که نیازمند توجه دقیق مهندسی دارد. منابع تغذیه‌ای که در خارج از مخزن غوطه‌وری نصب می‌شوند، باید گرمای تولیدشده توسط خود را از طریق اتصالات محکم شدهٔ عبوری از دیواره یا از طریق حلقه‌های خنک‌کنندهٔ اختصاصی منتقل کنند؛ این روش‌ها هم‌زمان با جلوگیری از آلودگی مایع، کارایی حرارتی را حفظ می‌کنند. قرارگیری داخلی این پیچیدگی رابط را از بین می‌برد، اما چالش‌هایی را در زمینهٔ تعمیر و نگهداری، نظارت و محافظت در برابر نفوذ مایع به مدارهای کنترلی حساس ایجاد می‌کند. انتخاب بین روش‌های نصب خارجی و داخلی، به‌طور بنیادی معیارهای انتخاب و گزینه‌های محصول موجود را شکل می‌دهد.

دفع گرما از منبع تغذیه خنک‌کننده با غوطه‌وری در مایع دی‌الکتریک باید در چارچوب ظرفیت کلی سیستم مدیریت حرارتی ارزیابی شود. هر واتی که توسط منبع تغذیه پراکنده می‌شود، بار حرارتی اضافی را نشان می‌دهد که زیرساخت خنک‌کننده باید آن را حذف کند و به‌طور مستقیم بر ظرفیت خنک‌کنندگی خالص در دسترس برای پردازنده‌های هوش مصنوعی تأثیر می‌گذارد. توپولوژی‌های تبدیل انرژی با بازده بالا این مشارکت حرارتی جانبی را به حداقل می‌رسانند، اما حتی منابع تغذیه‌ای که با بازده پنجاه و نه درصد کار می‌کنند نیز در سطوح توان کیلوواتی خروجی حرارتی قابل‌توجهی تولید می‌کنند. طراحان سیستم باید تولید گرمای منبع تغذیه را در مدل‌های حرارتی جامعی ادغام کنند که الگوهای گردش مایع، ظرفیت مبدل حرارتی و لایه‌بندی دمایی حالت پایدار درون مخزن غوطه‌وری را در نظر می‌گیرند.

مشخصات فنی حیاتی برای انتخاب منبع تغذیه خنک‌کننده با غوطه‌وری در سیستم‌های هوش مصنوعی

بهینه‌سازی چگالی توان و فرم‌فاکتور

چگالی توان نمایانگر یک معیار اساسی برای انتخاب منبع تغذیه‌ای با سیستم خنک‌کنندگی غوطه‌وری در زیرساخت‌های هوش مصنوعی با فضای محدود است. حذف رادیاتورهای بزرگ و مجموعه‌های خنک‌کنندگی با جریان هوا، امکان دستیابی منابع تغذیه‌ای سازگونده با سیستم غوطه‌وری را به چگالی توان حجمی‌ای فراهم می‌کند که از طرح‌های سنتی دو تا چهار برابر بیشتر است. این مزیت فشردگی، گزینه‌های انعطاف‌پذیرتری برای قرارگیری تجهیزات در طرح‌بندی مراکز داده فراهم می‌کند و سطح اشغال‌شده توسط تجهیزات تبدیل توان را کاهش می‌دهد. با این حال، طراحان باید افزایش چگالی را در مقابل نیازهای دسترسی برای تعمیر و نگهداری، نقاط اتصال پایش و نیازهای احتمالی گسترش ظرفیت در آینده متعادل کنند.

استانداردسازی فاکتورهای شکل در بازار منابع تغذیه خنک‌کننده با غوطه‌وری همچنان محدود است؛ بیشتر واحدها از طرح‌های مکانیکی سفارشی یا نیمه‌سفارشی پیروی می‌کنند که به‌طور خاص برای هندسه مخزن‌ها و پیکربندی‌های نصب طراحی شده‌اند. فرمت‌های قابل نصب روی رک که برای استفاده در محیط‌های غوطه‌وری اصلاح شده‌اند، معمولاً شامل مجموعه‌های اتصال‌دهنده دربسته و پوشش‌های هماهنگ (Conformal Coatings) هستند که امکان عملیات در محیط‌های با رطوبت بالا مجاور مخازن خنک‌کننده را فراهم می‌سازند. طراحی مکانیکی باید قادر به تحمل وزن و حجم مایعات دی‌الکتریک باشد که چگالی بسیار بالاتری نسبت به هوا دارند و بارهای فشار استاتیکی را بر روی پوسته‌ها و سازه‌های نصب ایجاد می‌کنند که از بارهای مشاهده‌شده در نصب‌های معمولی فراتر می‌رود.

مدیریت بازده و تولید گرما

بازده تبدیل به‌طور مستقیم بر هزینه‌های عملیاتی و ابعاد سیستم مدیریت حرارتی در پیکربندی‌های منبع تغذیه با خنک‌کنندگی غوطه‌ور (Immersion Cooling) تأثیر می‌گذارد. بهبود یک درصدی بازده در سطح توان ده کیلووات، مقدار گرمای دفع‌شده را به میزان صد وات کاهش می‌دهد که این امر منجر به کاهش قابل‌اندازه‌گیری در ظرفیت مورد نیاز زیرساخت‌های خنک‌کننده و هزینه‌های انرژی جاری می‌شود. توپولوژی‌های مدرن با بازده بالا که از نیمه‌هادی‌های کاربید سیلیکونی (SiC) و نیترید گالیوم (GaN) استفاده می‌کنند، بازده اوجی بیش از نود و شش درصد را به‌دست می‌آورند؛ با این حال، بازده در محدوده بارهای مختلف تغییرات قابل‌توجهی دارد. انتخاب مناسب نیازمند تحلیل منحنی‌های بازده در تطبیق با پروفایل‌های بار پیش‌بینی‌شده است و نمی‌توان تنها به مشخصات بازده اوج متکی بود.

ویژگی‌های تولید گرما در منبع تغذیه با سیستم خنک‌کنندگی غوطه‌ور، بر افزایش دمای مایع و نیازهای جریان‌دهی آن درون سیستم خنک‌کنندگی تأثیر می‌گذارد. منابع تغذیه‌ای که دفع گرما را در نواحی متمرکز انجام می‌دهند، شیب‌های دمایی محلی ایجاد می‌کنند که ممکن است نیازمند جریان‌دهی بهبودیافته‌تر مایع یا قرارگیری استراتژیک‌تر نسبت به ورودی‌های مبدل حرارتی باشند. تولید گرما در سراسر مراحل متعدد تبدیل، بار حرارتی یکنواخت‌تری ایجاد می‌کند، اما پیچیدگی مدل‌سازی و پایش حرارتی را افزایش می‌دهد. مهندسان باید هم بزرگی و هم توزیع فضایی دفع گرما از منبع تغذیه را هنگام ادغام این واحدها در طراحی مخازن غوطه‌ور و تعیین ابعاد تجهیزات خنک‌کننده کمکی در نظر بگیرند.

حفاظت الکتریکی و قابلیت‌های پاسخ به خطاهای الکتریکی

ویژگی‌های جامع حفاظت الکتریکی در منبع تغذیه با خنک‌کنندگی غوطه‌ور برای بارهای کاری هوش مصنوعی حیاتی از اهمیت بالایی برخوردارند. حفاظت در برابر اضافه‌ولتاژ، از آسیب‌دیدن شتاب‌دهنده‌های حساس هوش مصنوعی در شرایط خطا یا ترانزیت‌های راه‌اندازی جلوگیری می‌کند، در حالی که محدودسازی اضافه‌جریان، هم خود منبع تغذیه و هم تجهیزات متصل به آن را در برابر آسیب ناشی از اتصال کوتاه محافظت می‌کند. زمان پاسخ‌دهی سیستم حفاظتی به‌ویژه در کاربردهای ولتاژ پایین و جریان بالا حیاتی می‌شود؛ زیرا تشخیص و پاسخ‌دهی در مقیاس میلی‌ثانیه‌ای، از شکست فاجعه‌بار اتصالات نیمه‌هادی جلوگیری می‌کند. منابع تغذیه پیشرفته از نظارت پیش‌بینانه بهره می‌برند که شرایط عملیاتی غیرعادی را پیش از اینکه به رویدادهای حفاظتی تبدیل شوند، شناسایی می‌کند و امکان مداخلات پیشگیرانه در نگهداری را فراهم می‌سازد.

قابلیت‌های جداسازی خطا تعیین می‌کنند که آیا خرابی تکی منبع تغذیه سیستم خنک‌کننده غوطه‌ور (Immersion Cooling) می‌تواند به قطعی‌های گسترده‌تر سیستم منجر شود یا خیر. معماری‌های منبع تغذیه پشتیبان با استفاده از چندین منبع تغذیه موازی همراه با اشتراک فعال جریان، تحمل خطا را فراهم می‌کنند و امکان ادامه عملیات در ظرفیت کاهش‌یافته را در صورت خرابی تک واحدی فراهم می‌سازند. رابط‌های کنترل و ارتباطی باید امکان عملیات هماهنگ بین منابع تغذیه پشتیبان را فراهم کنند، در عین حال از جریان‌های گردشی یا تضادهای ولتاژی که ممکن است باعث فعال‌شدن نامناسب سیستم‌های حفاظتی شوند، جلوگیری نمایند. معیارهای انتخاب باید هم مکانیزم‌های داخلی حفاظتی و هم قابلیت‌های ادغام سیستم خارجی را ارزیابی کند تا استراتژی‌های مدیریت خطا با قابلیت اطمینان بالا امکان‌پذیر گردد.

ارزیابی سازگانی با مایعات خنک‌کننده دی‌الکتریک

سازگانی مواد و مقاومت در برابر تخریب بلندمدت

سازگاری مواد بین منبع تغذیهٔ خنک‌کنندهٔ غوطه‌ور و مایع دی‌الکتریک انتخاب‌شده، به‌طور اساسی قابلیت اطمینان عملیاتی و عمر خدماتی را تعیین می‌کند. شیمی‌های مختلف این مایع‌ها به‌صورت متفاوتی با سیستم‌های عایق‌بندی پلیمری، پوشش‌های محافظ (Conformal Coatings) و درزگیرهای الاستومری که معمولاً در الکترونیک قدرت به‌کار می‌روند، واکنش نشان می‌دهند. روغن‌های معدنی سازگاری عالی با اکثر مواد استاندارد را فراهم می‌کنند، اما عملکرد حرارتی محدودی دارند؛ در مقابل، فلوئوروکربن‌های مهندسی ظرفیت خنک‌کنندگی برتری ارائه می‌دهند، اما انتخاب مواد ویژه‌ای را برای جلوگیری از متورم‌شدن، نرم‌شدن یا تخریب شیمیایی سیستم‌های عایق‌بندی الزامی می‌سازند. سازندگان باید اسناد دقیق سازگاری را ارائه دهند که انواع مایع‌های مجاز و هرگونه محدودیت در مورد افزودنی‌ها یا آلاینده‌های موجود در مایع را مشخص کند.

قرار گرفتن بلندمدت قطعات تأمین‌کننده انرژی در معرض سیالات دی‌الکتریک می‌تواند حتی در غیاب تخریب مشخص، تغییرات ظریفی در خواص الکتریکی و مکانیکی این قطعات ایجاد کند. دی‌الکتریک خازن‌ها ممکن است دچار تغییر در گذردهی نسبی یا عامل پراکندگی شود که عملکرد فیلترها و ویژگی‌های تضعیف ریپل را تحت تأثیر قرار می‌دهد. سیستم‌های عایقی ترانسفورماتورها به‌صورت تدریجی رطوبت جذب می‌کنند یا بازدارنده‌های پلاستیکی خود را از دست می‌دهند که این امر حاشیه ولتاژ شکست و نرخ‌های پیرشدن حرارتی را تغییر می‌دهد. فرآیند انتخاب منبع تغذیه با خنک‌کنندگی غوطه‌وری باید شامل داده‌های آزمون عمر شتاب‌یافته باشد که پایداری عملکرد را در بازه‌های زمانی عملیاتی متناظر با مدت زمان پیش‌بینی‌شده نصب تأیید می‌کند؛ این بازه معمولاً برای کاربردهای مراکز داده بین پنج تا ده سال متغیر است.

مقاومت دی‌الکتریک و الزامات جداسازی الکتریکی

مقاومت دی‌الکتریک مایعات خنک‌کننده، عایق‌بندی الکتریکی بین اجزای تحت ولتاژ در منبع تغذیه با سیستم خنک‌سازی غوطه‌ور و همچنین بین منبع تغذیه و سازه‌های مخزن زمین‌شده را فراهم می‌کند. اکثر مایعات دی‌الکتریک مهندسی‌شده، ولتاژ شکستی بیش از پنجاه کیلوولت بر میلی‌متر ارائه می‌دهند که به‌مراتب بالاتر از مقاومت شکست هوا است؛ این امر امکان قرارگیری نزدیک‌تر اجزای فشارقوی و طراحی‌های فشرده‌تر را فراهم می‌سازد. با این حال، این عایق‌بندی به‌طور حیاتی به خلوص مایع وابسته است، زیرا آلودگی ذرات جامد و رطوبت حل‌شده در مایع، مقاومت شکست را به‌طور چشمگیری کاهش می‌دهند. طراحی منابع تغذیه باید شامل اقدامات فیلتراسیون و راهبردهای مدیریت رطوبت باشد تا ویژگی‌های دی‌الکتریک مایع در طول کل عمر عملیاتی آن حفظ شود.

پروتکل‌های آزمون عایل‌سازی الکتریکی برای صلاحیت‌سنجی منبع تغذیه سیستم خنک‌کنندگی غوطه‌ور باید محیط عملیاتی واقعی را منعکس کنند، نه اینکه صرفاً بر اساس استانداردهای آزمون عایل‌سازی در هوا متکی باشند. دنباله‌های آزمون باید ولتاژ شکست در شرایط غوطه‌وری در مایع، سطح آغاز تخلیه جزئی و مقاومت در برابر ردیابی (ترکینگ) روی سطوح عایق در حضور لایه‌های مایع را ارزیابی کنند. سیستم عایل‌سازی باید در تمام محدوده دمایی عملیاتی مایع، که معمولاً از شرایط راه‌اندازی سرد نزدیک به نقطه انجماد تا شصت درجه سانتی‌گراد یا بالاتر در شرایط بار حرارتی اوج امتداد دارد، سلامت و یکپارچگی خود را حفظ نماید. انتخاب منبع تغذیه مستلزم تأیید این است که حاشیه‌های عایل‌سازی در شرایط بدترین ترکیب‌های دما، سطح آلودگی و تنش ولتاژ، همچنان کافی باقی بمانند.

تطابق عملکرد حرارتی با ویژگی‌های مایع

بهینه‌سازی عملکرد حرارتی منبع تغذیه با سیستم خنک‌کنندگی غوطه‌وری نیازمند هماهنگی بین طراحی حرارتی اجزا و ویژگی‌های خاص انتقال حرارت مایع دی‌الکتریک انتخاب‌شده است. مایعاتی با رسانایی حرارتی بالاتر، امکان استفاده از چگالی توان بالاتر برای اجزا و کاهش نیاز به جرم حرارتی را فراهم می‌کنند؛ در مقابل، مایعاتی با رسانایی حرارتی پایین‌تر نیازمند سطوح تماس بزرگ‌تر یا راهبردهای ارتقای انتقال حرارت اجباری هستند تا دمای قابل قبول اجزا حفظ شود. رابطهٔ دمایی-ویسکوزیتهٔ مایع، الگوهای جابجایی آزاد اطراف اجزای تولیدکنندهٔ حرارت را تحت تأثیر قرار می‌دهد؛ به‌طوری‌که مایعات با ویسکوزیتهٔ بالاتر جریان‌های ناشی از شناوری ضعیف‌تری ایجاد می‌کنند که ممکن است حتی در طرح‌هایی که به‌ظاهر فاقد فن هستند، نیازمند ایجاد جریان اجباری باشند.

ظرفیت گرمایی حجمی مایع دی‌الکتریک، بر ثابت‌های زمانی حرارتی و پاسخ دمایی گذراي منبع تغذیه با سیستم خنک‌کنندگی غوطه‌ور در حین تغییرات بار تأثیر می‌گذارد. مایعات با ظرفیت گرمایی بالا، بافر حرارتی ایجاد می‌کنند که نوسانات دمایی اجزا را در حین تغییرات ناگهانی توان کاهش داده و تنش حرارتی را کم می‌کند و به‌طور بالقوه عمر عملیاتی را افزایش می‌دهد. در مقابل، مایعات با ظرفیت گرمایی پایین به تغییرات تولید گرما سریع‌تر پاسخ می‌دهند و تنظیم حرارتی سریع‌تری را امکان‌پذیر می‌سازند، اما ممکن است اجزا را در معرض نوسانات دمایی بزرگ‌تری قرار دهند. معیارهای انتخاب باید ویژگی‌های پاسخ حرارتی را در چارچوب الگوهای پیش‌بینی‌شده بار هوش مصنوعی ارزیابی کنند که ممکن است شامل انتقال‌های سریع بین حالت بیکاری و حالت توان کامل با فواصلی از چند میلی‌ثانیه تا چند دقیقه باشد.

ملاحظات ادغام و راه‌اندازی سیستم

استراتژی‌های آب‌بندی اتصال‌دهنده‌ها و حفظ مایع

در نصب‌های تأمین برق با سیستم خنک‌کنندگی غوطه‌ور، آب‌بندی اتصال‌دهنده‌ها یکی از مهم‌ترین ملاحظات قابلیت اطمینان محسوب می‌شود. اتصالات برقی باید همزمان مسیرهای الکتریکی کم‌مقاومتی را فراهم کنند که قادر به عبور صدها آمپر جریان باشند و در عین حال، تمامی یکپارچگی آب‌بندی سیال را در طول هزاران چرخه حرارتی و سال‌ها خدمات عملیاتی حفظ نمایند. سیستم‌های اتصال‌دهنده آب‌بند شده تخصصی که از واشرهای فشاری، پوشش‌دهی رزینی (پاتینگ) قسمت عقبی اتصال‌دهنده یا عبورهای هرماتیک جوش‌خورده استفاده می‌کنند، از نفوذ سیال در امتداد مسیرهای رسانا جلوگیری می‌کنند؛ نفوذی که ممکن است منجر به نشت خارجی یا آلودگی تجهیزات مجاور شود. فناوری اتصال‌دهنده باید هم نیازهای چگالی جریان الکتریکی و هم تنش‌های مکانیکی ناشی از فشار سیال، تغییرات دما و نحوه نصب و دست‌کاری را تحمل کند.

containment سیالات فراتر از اتصال‌دهنده‌های اصلی گسترش می‌یابد و تمام نفوذها از پوشش منبع تغذیه خنک‌کننده غوطه‌ور (immersion cooling) را شامل می‌شود، از جمله خطوط حسگری، رابط‌های ارتباطی و اتصالات نظارتی. هر نفوذی مسیر بالقوه نشتی محسوب می‌شود که نیازمند فناوری آب‌بندی مناسب است که با شیمی سیال و شرایط فشار تطبیق داده شده باشد. اتصالات کنترلی و نظارتی معمولاً از استانداردهای اتصال‌دهنده‌های صنعتی درج‌شده (sealed) بهره می‌برند که قابلیت اطمینان آن‌ها در خدمات غوطه‌وری اثبات شده است، در حالی که اتصالات توان با جریان بالا ممکن است نیازمند راه‌حل‌های آب‌بندی سفارشی باشند که به‌طور خاص برای آن کاربرد توسعه یافته‌اند. استراتژی آب‌بندی باید انبساط حرارتی متفاوت بین رساناها، مواد آب‌بندی و ساختارهای پوشش را در نظر بگیرد که منجر به تنش مکانیکی دوره‌ای می‌شود و ممکن است با گذشت زمان منجر به تخریب آب‌بندی شود.

ادغام رابط نظارت و کنترل

امکانات نظارت جامع برای حفظ قابلیت اطمینان و بهینه‌سازی عملکرد منبع تغذیه خنک‌کننده غوطه‌ور در پیاده‌سازی‌های هوش مصنوعی ضروری است. رابط‌های نظارت از راه دور، دید بلادرنگ به ولتاژ و جریان خروجی، دمای داخلی، معیارهای بازده و وضعیت خطاهای سیستم فراهم می‌کنند بدون اینکه نیازی به دسترسی فیزیکی به تجهیزات غوطه‌ور در مایع دی‌الکتریک باشد. پروتکل‌های ارتباطی که امکان ادغام با سیستم‌های مدیریت ساختمان و پلتفرم‌های هماهنگ‌سازی زیرساخت هوش مصنوعی را فراهم می‌کنند، استراتژی‌های کنترل هماهنگی را امکان‌پذیر می‌سازند که تحویل توان را در پاسخ به تغییرات بار محاسباتی و شرایط حرارتی بهینه می‌کنند. معماری نظارت باید از گردش‌کارهای نگهداری پیش‌بینانه پشتیبانی کند و پارامترهای عملیاتی مرتبط با مکانیزم‌های پیرشدن و حالت‌های احتمالی خرابی را ردیابی نماید.

قابلیت‌های رابط کنترلی، نحوه ادغام منبع تغذیه با سیستم خنک‌کنندگی غوطه‌ور در سلسله‌مراتب گسترده‌تر مدیریت توان در مراکز داده هوش مصنوعی را تعیین می‌کنند. منابع تغذیه پیشرفته از تنظیم پویای ولتاژ خروجی پشتیبانی می‌کنند و امکان بهینه‌سازی دقیق نقطه عملیاتی پردازنده‌ها را برای افزایش بازده یا عملکرد فراهم می‌آورند. عملکردهای محدودسازی جریان و سقف‌گذاری توان، امکان مدیریت بار در سطح زیرساخت را فراهم می‌کنند تا از قطع شدن کلیدهای اتوماتیک جلوگیری شود و عملیات در محدوده‌های تقاضای برق ارائه‌شده توسط شرکت‌های توزیع برق حفظ گردد. زمان پاسخ‌دهی کنترل در کاربردهایی که از مقیاس‌بندی سریع توان استفاده می‌کنند، حیاتی می‌شود؛ زیرا تأخیر بین ورودی دستور و تنظیم خروجی ممکن است منجر به نوسانات ولتاژ یا محدودسازی اثربخشی استراتژی‌های بهینه‌سازی پویا شود.

معماری افزونگی و طراحی تحمل خطا

استراتژی‌های پشتیبانی برای استقرار منابع تغذیه با سیستم خنک‌کنندگی غوطه‌ور باید بین بهبود قابلیت اطمینان، هزینه، پیچیدگی و محدودیت‌های فضای فیزیکی تعادل برقرار کنند. پیکربندی‌های پشتیبان موازی که از چندین منبع تغذیه استفاده کرده و بار را به یک اتوبوس بار مشترک توزیع می‌کنند، قابلیت تحمل خطا به صورت N+1 را فراهم می‌سازند و امکان ادامه عملیات در حین خرابی یک واحد را فراهم می‌آورند. این منابع تغذیه باید دارای کنترل‌کننده‌های فعال اشتراک جریان باشند که بار را به‌طور یکنواخت بین واحدهای موازی توزیع کرده و از جریان‌های گردشی که باعث کاهش بازده و ایجاد نرخ‌های مختلف پیرشدن می‌شوند، جلوگیری کنند. قابلیت جایگزینی گرم (Hot-swap) امکان تعویض واحدهای خراب‌شده را بدون خاموش‌کردن سیستم فراهم می‌سازد، هرچند این امر نیازمند طراحی دقیق ترتیب اتصال و قطع اتصال است تا از ایجاد نوسانات ولتاژ که ممکن است به پردازنده‌های هوش مصنوعی حساس آسیب برساند، جلوگیری شود.

رویکردهای جایگزین افزونگی، توزیع تأمین توان را در سراسر مناطق مستقل یا کارتهای پردازشی انجام می‌دهند و تأثیر خرابی‌های تکی منابع تغذیه را به بخش‌های مجزای زیرساخت محاسباتی محدود می‌سازند. این معماری، تحمل خطا در سطح کل سیستم را در ازای کاهش شعاع تأثیر خرابی (blast radius) قربانی می‌کند؛ به این ترتیب، در حین وقوع خرابی‌ها امکان ادامه عملیات با ظرفیت جزئی فراهم می‌شود و همزمان انتخاب منابع تغذیه را با کاهش نیاز به رتبه جریان اسمی هر واحد ساده‌تر می‌سازد. رویکرد توزیع‌شده به‌طور طبیعی با معماری‌های آموزش هوش مصنوعی امروزی همسو است که از مکانیزم‌های بازیابی از نقطه ذخیره‌سازی (checkpoint-restart) استفاده می‌کنند و در برابر خرابی‌های جزئی گره‌ها تحمل‌پذیر هستند. انتخاب بین معماری‌های افزونگی متمرکز و توزیع‌شده به نیازهای خاص قابلیت اطمینان، امکانات نگهداری و ویژگی‌های تاب‌آوری محاسباتی بار کاری هوش مصنوعی مورد نظر بستگی دارد.

پروتکل‌های اعتبارسنجی عملکرد و آزمون

آزمون بار تحت پروفایل‌های واقعی بار کاری هوش مصنوعی

آزمون جامع بارگذاری برای منبع تغذیهٔ خنک‌کننده با غوطه‌وری باید از نمودارهای جریانی استفاده کند که نمایندهٔ پویایی واقعی بارهای هوش مصنوعی هستند، نه بارگذاری‌های سادهٔ حالت پایدار یا مقاومتی. عملیات آموزش و استنتاج شبکه‌های عصبی، امضاهای توان مشخصی ایجاد می‌کنند که شامل انتقال‌های سریع بین فازهای محاسباتی، رویدادهای همگام‌سازی دوره‌ای که گام‌های بار همبسته‌ای را در چندین پردازنده ایجاد می‌کنند، و تغییرات آماری در توان لحظه‌ای ناشی از دنباله‌های عملیاتی وابسته به داده هستند. پروتکل‌های آزمون باید این ویژگی‌های زمانی را با استفاده از بارهای الکترونیکی برنامه‌پذیر که قادر به بازتولید نرخ‌های تغییر (slew rates)، چرخه‌های کاری (duty cycles) و الگوهای تغییرات تصادفی مشاهده‌شده در سیستم‌های تولیدی هوش مصنوعی هستند، ثبت کنند.

آزمون‌های حرارتی تأیید می‌کنند که منبع تغذیه با سیستم خنک‌کننده غوطه‌ور، عملکرد مشخص‌شده را در تمامی شرایط کاری — از جمله تغییرات دمای سیال، حداقل و حداکثر دمای محیط، و شرایط گذراي حرارتی در زمان راه‌اندازی سیستم یا انتقال بار — حفظ می‌نماید. این آزمون‌ها باید تأیید کنند که دمای اجزا در ترکیب بدترین شرایط (شامل بیشترین بار، کمترین دبی سیال و دمای ورودی بالاتر سیال) در محدوده مقادیر مجاز تعیین‌شده باقی می‌ماند. تصویربرداری حرارتی و سنسورهای دمای تعبیه‌شده، مکان نقاط داغ و گرادیان‌های دمایی را ثبت کرده و اطلاعاتی را برای پیش‌بینی قابلیت اطمینان فراهم می‌سازند و محدودیت‌های احتمالی طراحی را آشکار می‌کنند. آزمون‌های بلندمدت در دماهای بالاتر، مکانیسم‌های پیرشدگی را تسریع کرده و روشهای تخریبی را آشکار می‌سازند که ممکن است در آزمون‌های کوتاه‌مدت صلاحیت‌سنجی مشاهده نشوند.

سازگانی الکترومغناطیسی در محیط‌های غوطه‌ور

آزمون سازگاری الکترومغناطیسی برای منبع تغذیه خنک‌کننده با غوطه‌وری باید ویژگی‌های منحصر به‌فرد انتشار میدان‌های الکترومغناطیسی در مایعات دی‌الکتریک را بررسی کند. گذردهی نسبی بالاتر اکثر مایعات خنک‌کننده نسبت به هوا، مشخصه‌های آنتن و مکانیسم‌های جفت‌شدن میدان بین منبع تغذیه و تجهیزات اطراف را تغییر می‌دهد. آزمون انتشارات هادی، نویز موجی و سوئیچینگ را که به شبکه‌های توزیع توان تزریق می‌شوند، ارزیابی می‌کند؛ این نویزها ممکن است به مدارهای آنالوگ حساس یا رابط‌های ارتباطی موجود در مخزن غوطه‌وری جفت شوند. آزمون انتشارات تابشی، شدت میدان‌ها را در هر دو محیط هوا و مایع مشخص می‌کند و اطمینان حاصل می‌کند که این منبع تغذیه با محدودیت‌های نظارتی و سازگاری با سیستم‌های الکترونیکی مجاور مطابقت دارد.

آزمون حساسیت الکترومغناطیسی تأیید می‌کند که منبع تغذیه خنک‌کننده غوطه‌ور عملکرد پایداری را در برابر منابع تداخل خارجی از جمله میدان‌های فرکانس رادیویی، پدیده‌های تخلیه الکترواستاتیک و نوسانات گذرا در شبکه‌های توزیع انرژی حفظ می‌کند. مراکز داده هوش مصنوعی ممکن است حاوی تعداد زیادی منبع تداخل الکترومغناطیسی از جمله منابع تغذیه سوئیچینگ، درایوهای فرکانس متغیر و سیستم‌های ارتباطات بی‌سیم باشند. این منبع تغذیه باید در تمام حالت‌های عملیاتی، مقاومت لازم را در برابر این منابع تداخل نشان دهد و هیچ انحرافی در ولتاژ خروجی، قطع‌شدگی‌های غیرضروری سیستم‌های حفاظتی یا اختلال در سیستم‌های کنترل ایجاد نکند. پروتکل‌های آزمون باید شامل مقاومت در برابر تداخلات پیوسته و همچنین اغتشاشات گذرا باشد که به طور متفاوتی بر مکانیزم‌های حفاظتی و فیلترینگ تأثیر می‌گذارند.

آزمون قابلیت اطمینان و اعتبارسنجی شتاب‌دار عمر مفید

اعتبارسنجی قابلیت اطمینان منبع تغذیه با سیستم خنک‌کنندگی غوطه‌ور نیازمند پروتکل‌های آزمون عمر شتاب‌یافته است که سال‌ها فعالیت عملیاتی را در مدت‌زمان‌های آزمونی قابل‌مدیریت فشرده می‌کنند. آزمون‌های چرخه‌ای دما، واحدها را به تحرکات حرارتی مکرر در سراسر محدوده عملیاتی تحت فشار قرار می‌دهند و با نرخی شتاب‌یافته، آسیب خستگی را در اتصالات لحیم، سیم‌های باند و رابط‌های مواد انباشته می‌کنند. دنباله‌های چرخه‌ای توان، بین شرایط بار کامل و بار سبک جایگزین می‌شوند و اجزای الکترونیکی را با گرادیان‌های حرارتی و تغییرات چگالی جریان تحت فشار قرار می‌دهند که مکانیسم‌های اصلی پیرشدگی در افزاره‌های نیمه‌هادی و اجزای مغناطیسی را به‌راه می‌اندازند. طراحی آزمون باید چرخه‌های تنش کافی را انباشته کند تا کاهش قابل‌اندازه‌گیری ایجاد شود، در عین حال از شرایط تنش اضافی که موجب بروز مکانیسم‌های خرابی غیرمعمول در شرایط عملیاتی عادی می‌شوند، جلوگیری شود.

آزمون قرارگیری بلندمدت در معرض سیالات، سازگانی مواد و پایداری عملکرد آن‌ها را در دوره‌های غوطه‌وری طولانی‌مدت تأیید می‌کند. واحدهای آزمون به‌صورت مداوم در سیالات دی‌الکتریک نماینده کار می‌کنند، در حالی که تغییرات پارامترهای الکتریکی، مقاومت عایقی، استحکام دی‌الکتریک و خواص مکانیکی تحت نظارت قرار دارند. تحلیل سیال در فواصل منظم، تولید آلاینده‌ها، کاهش افزودنی‌ها و تغییرات شیمیایی را پیگیری می‌کند که ممکن است نشان‌دهنده تخریب اجزای تأمین‌کننده باشند. همبستگی بین تغییرات وضعیت سیال و روندهای عملکرد الکتریکی، توصیه‌های مربوط به بازه‌های نگهداری و زمان‌بندی تعویض سیال را تعیین می‌کند. در انتخاب منبع تغذیه خنک‌کننده غوطه‌وری، باید داده‌های آزمون عمر شتاب‌یافته موجود را که عملکرد پایدار را در دوره‌هایی معادل با عمر طراحی‌شده برای استقرار نشان می‌دهند، در نظر گرفت.

سوالات متداول

برای منبع تغذیه خنک‌کننده غوطه‌وری که برای شتاب‌دهنده‌های هوش مصنوعی استفاده می‌شود، چه ولتاژ خروجی‌ای را باید مشخص کنم؟

نیازهای ولتاژ شتاب‌دهنده‌های هوش مصنوعی بسته به معماری پردازنده متفاوت است، اما معمولاً برای ریل‌های منطق هسته بین ۰٫۷ تا ۱٫۲ ولت و برای ولتاژهای کمکی مربوط به مدارهای حافظه و رابط، بین ۱٫۸ تا ۱۲ ولت قرار دارد. به جای تعیین ولتاژهای خروجی ثابت، پیاده‌سازی‌های مدرن هوش مصنوعی به‌طور فزاینده‌ای از منابع تغذیه قابل تنظیم استفاده می‌کنند که امکان مقیاس‌بندی پویای ولتاژ و فرکانس (DVFS) را فراهم می‌آورند تا عملکرد در واحد مصرف انرژی (Watt) بهینه‌سازی شود. مشخصات ایده‌آل شامل یک بازهٔ ولتاژ قابل برنامه‌ریزی است که تمام نقاط کاری مورد استفادهٔ پردازنده‌های هدف شما را پوشش دهد، با دقت تنظیم بهتر از ±۱۰ میلی‌ولت و پاسخ گذرا به‌قدری سریع که در طول تغییرات بار با نرخی بیش از یک آمپر در میکروثانیه، ولتاژ را در محدودهٔ مجاز حفظ کند. در صورتی که پردازنده‌های شما به چندین ریل ولتاژ نیاز داشته باشند، منابع تغذیه با چندین خروجی مستقل را در نظر بگیرید؛ زیرا این امر معماری سیستم را در مقایسه با استفاده از چندین واحد تک‌خروجی به‌صورت سری‌العمل ساده‌تر می‌کند.

خنک‌کنندگی غوطه‌ور چگونه بر بازدهی منبع تغذیه نسبت به روش‌های خنک‌کننده هوایی تأثیر می‌گذارد؟

خنک‌کنندگی غوطه‌ور می‌تواند بازده منبع تغذیه را نسبت به طرح‌های معادل خنک‌شونده با هوا که در سطوح توان مشابهی کار می‌کنند، حدود یک تا سه درصد بهبود بخشد. این بهبود عمدتاً ناشی از کاهش دمای اجزا است که توسط مدیریت حرارتی برتر فراهم می‌شود؛ زیرا تلفات سوئیچینگ نیمه‌هادی‌ها، تلفات هسته‌های مغناطیسی و تلفات مقاومتی رساناها همگی با کاهش دما کاهش می‌یابند. با این حال، مزیت بازدهی به‌طور قابل‌توجهی به ویژگی‌های خاص مایع خنک‌کننده بستگی دارد؛ به‌طوری‌که مایعات با هدایت حرارتی بالا، بهره‌برداری بیشتری نسبت به محیط‌های خنک‌کننده کم‌کارتر فراهم می‌کنند. همچنین در مقایسهٔ بازدهی باید تلفات نامطلوب (پارازیتی) ناشی از سیستم‌های پمپاژ مایع را نیز لحاظ کرد که ممکن است بخشی از بهبودهای مستقیم بازده منبع تغذیه را جبران کند. هنگام ارزیابی بازده کل سیستم، باید توجه داشت که حذف فن‌های خنک‌کننده، مصرف انرژی آن‌ها را به‌طور کامل از بین می‌برد؛ که این امر معمولاً بسته به نیازهای خنک‌سازی، صرفه‌جوییی معادل ده تا پنجاه وات در هر منبع تغذیه ایجاد می‌کند و این صرفه‌جویی، سهمی قابل‌توجه‌تر در بازده کلی زیرساخت نسبت به بهبود جزئی در بازده تبدیل به‌تنهایی دارد.

آیا می‌توان یک منبع تغذیه استاندارد را برای کاربردهای خنک‌سازی غوطه‌وری اصلاح و نصب کرد؟

معمولاً ارتقاء تأمین‌کننده‌های استاندارد برق با سیستم خنک‌کنندگی هوا برای استفاده در محیط غوطه‌ور (امرسیون) توصیه نمی‌شود و به‌ندرت بدون انجام اصلاحات گسترده‌ای که در واقع معادل طراحی مجدد کامل سیستم است، قابل‌دستیابی است. تأمین‌کننده‌های استاندارد از مواد و اجزایی استفاده می‌کنند که برای عملکرد در محیط دی‌الکتریک هوایی انتخاب شده‌اند و ممکن است در برابر قرار گرفتن طولانی‌مدت در معرض مایعات خنک‌کننده، از جمله سیستم‌های عایقی، چسب‌ها و مواد الاستومریک، مقاومت کافی نداشته باشند؛ زیرا این مواد ممکن است در حالت غوطه‌وری تخریب شده یا پیش‌از موعد از کار بیفتند. فن‌های خنک‌کننده‌ای که در طراحی‌های معمولی به‌صورت یکپارچه تعبیه شده‌اند، قادر به کار در محیط‌های مایع نیستند و حذف آن‌ها منجر به مدیریت حرارتی ناکافی برای اجزایی می‌شود که بر اساس سیستم خنک‌کنندگی اجباری هوایی طراحی شده‌اند. اگرچه برخی از اجزا مانند ترانسفورماتورها و سیم‌پیچ‌ها ممکن است تحمل غوطه‌وری در مایع را داشته باشند، اما ادغام کامل سیستم شامل اتصال‌دهنده‌ها، پوشش‌ها و مدارهای حفاظتی نیازمند طراحی اختصاصی برای ارائه قابل‌اطمینان در محیط غوطه‌وری است. سازمان‌هایی که قصد استفاده از سیستم خنک‌کنندگی غوطه‌وری برای زیرساخت‌های هوش مصنوعی را دارند، باید برای تأمین‌کننده‌های تخصصی برق با قابلیت خنک‌کنندگی غوطه‌وری برنامه‌ریزی کنند و از تلاش برای اصلاح تجهیزات موجود خودداری نمایند.

چه نیازمندی‌های نگهداری‌ای برای منابع تغذیه در سیستم‌های خنک‌کننده با غوطه‌وری باید انتظار داشت؟

نیازهای نگهداری برای منابع تغذیه خنک‌شونده با غوطه‌وری عموماً در مقایسه با معادل‌های خنک‌شونده با هوا کاهش می‌یابد، زیرا با حذف فن‌های خنک‌کننده، فیلترهای هوا و مشکلات تجمع گرد و غبار — که عامل اصلی برنامه‌ریزی نگهداری پیشگیرانه در سیستم‌های معمولی هستند — این نیازها به‌طور قابل توجهی کاهش می‌یابند. فعالیت‌های اصلی نگهداری بر روی نظارت و حفظ کیفیت مایع دی‌الکتریک از طریق آنالیز دوره‌ای و فیلتراسیون یا تعویض آن در صورت لزوم متمرکز است، هرچند این کار یک وظیفه سطح سیستمی است نه نگهداری خاصِ منبع تغذیه. بازرسی اتصالات الکتریکی در فواصل زمانی توصیه‌شده، اطمینان حاصل می‌کند که اتصال‌دهنده‌های دربسته سلامت خود را حفظ کرده‌اند و هیچ نشتی مایعی در طول مسیرهای رسانا رخ نداده است. نظارت بر داده‌های روندی مربوط به دقت ولتاژ خروجی، شاخص‌های بازده و دماهای داخلی، امکان انجام اقدامات نگهداری پیش‌بینانه را پیش از وقوع خرابی‌ها فراهم می‌کند. بیشتر نصب‌های منابع تغذیه خنک‌شونده با غوطه‌وری فاصله‌های نگهداری‌ای را به دست می‌آورند که بر حسب سال (نه ماه) اندازه‌گیری می‌شوند؛ و میانگین زمان بین خرابی‌ها (MTBF) در صورت انتخاب صحیح و کارکرد در محدوده پارامترهای طراحی، اغلب از ۱۰۰٬۰۰۰ ساعت بیشتر است که این امر بار عملیاتی را در مقایسه با نگهداری منابع تغذیه خنک‌شونده با فن به‌طور قابل توجهی کاهش می‌دهد.

فهرست مطالب