مرکز داده 9 آبان 1403 4 دقیقه مطالعه 0 نظر

ایان باک از Nvidia دیدگاه خود را برای مرکز داده GPU به اشتراک می گذارد!

ایان باک: «ما واقعاً به تراشه‌ها فکر نمی‌کنیم!» ایان باک بیشتر عمر خود را صرف فکر کردن به تراشه‌ها کرده است. اما اکنون، رئیس محاسبات شتاب در انویدیا، بزرگترین شرکت تولید تراشه در جهان، به فکر بزرگ‌تری است. باک، همچنین معاون مرکز داده و کسب‌وکار HPC شرکت، با اشاره به نسل بعدی خط GPU خود به DCD می‌گوید: «شما نمی‌توانید بلک ول را به عنوان یک تراشه خریداری کنید. دلیل خوبی دارد: می‌خواهد با CPU یکپارچه شود. می‌خواهد با NV Link یکپارچه شود. «او می خواهد وصل شود». انویدیا به جای پرداختن به نیمه هادی‌ها، خود را به یک شرکت پلتفرم تبدیل کرد. دیگر نگران یک شتاب دهنده واحد نیست و در عوض روی سیستم‌های بزرگ و یکپارچه تمرکز می‌کند.

معاون محاسبات تسریع شده طراح تراشه در مورد پردازش تسریع شده صحبت می کند!

باک می‌گوید: «این تصمیمی بود که ما در نسل پاسکال (در سال 2016) گرفتیم، زیرا هوش مصنوعی می‌خواست روی پردازنده‌های گرافیکی بیشتری باشد. «دوران P۱۰۰ آنچه را که می‌سازیم و آنچه را که به بازار می‌آوریم یا در دسترس قرار می‌دهیم تغییر داده است و اکنون به سیستم‌ها بستگی دارد.»

باک می‌گوید این شروع به تغییر ساختار مراکز داده شده است. «فرصت محاسبات متحول‌کننده با ابر رایانه آغاز شد، اما با ظهور هوش مصنوعی گسترش یافت.

هر مرکز داده در حال تبدیل شدن به یک کارخانه هوش مصنوعی است. «این با شکست یا مگاوات اندازه‌گیری نمی‌شود، بلکه با توکن در ثانیه و تعداد ترابایت داده‌ای که شما در حال تبدیل به سودهای بهره‌وری برای شرکت خود هستید، اندازه‌گیری می‌شود.»

این فرصت، حباب یا غیر حباب، بهمنی از ساخت مرکز داده جدید را به راه انداخته است. باک می‌گوید: «اما آن‌ها نمی‌توانند دو سال برای یک پروژه ساختمانی صبر کنند.

ما شاهد شتاب افرادی بوده‌ایم که زیرساخت‌های قدیمی را بازنشسته می‌کنند؛ آن‌ها فقط زیرساخت‌های CPU خود را جابه‌جا می‌کنند، پردازنده‌های گرافیکی خود را قرار می‌دهند و شتاب می‌دهند تا هر مرکز داده بتواند یک کارخانه هوش مصنوعی باشد.» او افزود: «آنچه می‌بینید فقط یک پردازنده گرافیکی از انویدیا نیست، بلکه ترکیبی از پلتفرم‌ها و اکوسیستم‌ها است که به همه اجازه می‌دهد نوع درست کارخانه هوش مصنوعی و حجم کاری مورد نیاز خود را بسازند. «همه آن‌ها در مراحل مختلف آن فرآیند یا در نقاط مختلف بهینه سازی خواهند بود.» البته، همان‌قدر که انویدیا سعی می‌کند از تمرکز بر تراشه‌های خاص در این کارخانه‌های به اصطلاح «AI» دور شود، نقطه طراحی حرارتی آن‌ها (TDP) ترکیب بسیاری از بقیه سیستم را مشخص می‌کند.

باک می‌گوید: هاپر ۷۰۰ وات است و ما با هوا خنک می‌کنیم.

او میفزاید: «HGXB100 نیز ۷۰۰ وات است، به‌گونه‌ای طراحی شده است که دقیقاً در جایی که هاپر قرار داشت قرار بگیرد. بنابراین وقتی HGXB100 وارد بازار می‌شود، همه سرورهای ما، کل مرکز داده ما، حتی قدرت رک، می‌توانند ثابت بمانند.

باک می‌گوید این صنعت می‌تواند «کل اکوسیستم را بگیرد، آن را ارتقا دهد و در مقیاس به کار گیرد و او می‌گوید، مشتریان «تمام مزایای GPU Blackwell را دریافت می‌کنند، این که P4، موتور ترانسفورماتور، دو برابر سریع‌تر از NV Link بین آن‌ها است. بنابراین به همین دلیل بلک‌ول خیلی سریع‌تر از هاپر وارد بازار خواهد شد.

این شرکت همچنین یک نسخه ۱۰۰۰ واتی از HGX دارد: «سیلیکون مشابه، تغییرات جزئی در سرورها، آن‌ها باید کمی بلندتر باشند و یک راه‌حل خنک‌کننده هوا متفاوت باشند. اساساً بیشترین کاری که می‌توانید با خنک‌کننده هوا انجام دهید.

اما بعد از این مرحله همه چیز کمی پیچیده‌تر می‌شود. باک می‌گوید: «برای NVL72، ما می‌خواهیم مطمئن شویم که بهترین‌های موجود را داریم،» با رک شامل پردازنده‌های گرافیکی B۲۰۰ این ۱۲۰۰ وات در هر GPU است و به موتور واقعی خنک‌کننده مایع تبدیل می‌شود.

چهار پردازنده گرافیکی در 1U؟ Liquid برای درک مزایای NVL۷۲، که مزایای عملکرد استنتاج ۳۰ برابر سریع‌تر را ارائه می‌دهد، بسیار مهم است.

با این حال، بهترین همیشه بهترین نیست. او استدلال می کند: «TDP راه درستی برای پاسخ به این سؤال نیست. حجم کار چیست و چه چیزی برای راه اندازی شما منطقی تر است؟ اگر مدل استنباط ۷ میلیارد پارامتر یا ۷۰ میلیارد را انجام می‌دهید، HGX ممکن است ایده‌آل باشد و ممکن است همیشه به ۱۰۰٪ برق نیاز نداشته باشد.

با این حال، روند به وضوح به سمت تراشه‌های بزرگتر است که انرژی بیشتری مصرف می‌کنند و باید تا دمای پایین خنک شوند. انویدیا خود بخشی از برنامه تراشه‌های خنک‌کننده وزارت انرژی ایالات متحده است که بر راه‌حل‌های خنک‌کننده رادیکال برای نیمه‌رساناهای داغ‌تر متمرکز است. باک از اظهار نظر در مورد تکامل TDP خودداری کرد، به خصوص که شرکت هر سال به نسخه‌های GPU منتقل می‌شود.

او می‌گوید: «ما تا جایی که می‌توانیم سریع کار می‌کنیم. «بدون هیچ انتظاری و بدون رزرو. ما بهترین‌ها را می‌سازیم و جلو می‌رویم.»

آیا این مطلب برای شما مفید بود؟

0 بازخورد

مقالات مرتبط با این مطلب

13 دقیقه مطالعه

آیا تله‌پورترهای ماهواره‌ای پایدار می‌توانند مزیتی در یک مارکت شلوغ داشته باشند؟

هوش مصنوعی 27 آبان 1403 13 دقیقه مطالعه

در بازاری که همچنان چالش‌برانگیز است، اپراتورها کجا می‌توانند با سبز شدن در مصرف انرژی صرفه‌جویی کنند؟ تله‌پورت‌های ماهواره‌ای که گاهی ایستگاه‌های زمینی و بخش‌های زمینی نامیده می‌شوند، از او…

5 دقیقه مطالعه

AEP، Hyperscaler و Data Center Coalition در مورد طرح قیمت‌گذاری انرژی برای مراکر داده ابری اوهایو بحث می‌کنند!‌؟

مرکز داده 27 آبان 1403 5 دقیقه مطالعه

در اوهایو، گسترش سریع مراکز داده توسط فرامقیاس‌کننده‌های گوگل، مایکروسافت، آمازون و متا، و همچنین روند رو به افزایش کولوکیشن و پردازشگرهای داده کوچک‌تر، ارائه‌دهندگان برق را در معرض خطر قرار…

14 دقیقه مطالعه

آیا انرژی هسته ای و SMR راه حلی برای مشکلات انرژی مرکز داده است؟

هوش مصنوعی 26 آبان 1403 14 دقیقه مطالعه

انتظار می‌رود تقاضای انرژی مرکز داده طی پنج سال آینده افزایش یابد و مصرف ایالات متحده احتمالاً از ۱۷ گیگاوات در سال ۲۰۲۲ به ۳۵ گیگاوات در سال ۲۰۳۰ افزایش یابد. مراکز داده مخصوص هوش مصنوعی، م…

ایان باک از Nvidia دیدگاه خود را برای مرکز داده GPU به اشتراک می گذارد!

آیا این مطلب برای شما مفید بود؟

نظرات کاربران

مقالات مرتبط با این مطلب