تعادل انویدیا در فضای ابری

غول پردازنده گرافیکی شهرت و مقیاس دارد، اما یک هایپراسکیلر نیست. با وجود ارزش کمی بیش از ۳ تریلیون دلار، Nvidia  عصبی است. رشد سریع سازنده  GPU، یکی از با ارزش‌ترین شرکت‌های جهان، در دو سال گذشته بر پایه‌های متزلزلی بنا شده است: در حالی که تراشه‌های آن در قلب انقلاب هوش مصنوعی قرار دارند، ابر مقیاس‌کننده‌هایی که انویدیا به آن‌ها به عنوان مهم‌ترین آن‌ها اعتماد می‌کند. مشتریان نیز بزرگترین رقبای آن هستند. خدمات وب آمازون، مایکروسافت و گوگل در تلاش برای صرفه‌جویی در هزینه‌ها و یافتن یک مزیت منحصربه‌فرد، در حال توسعه تراشه‌های هوش مصنوعی خود هستند.

در همان زمان، همان شرکت‌های ابری آماده کسب درآمد بیشتری از پردازنده‌های گرافیکی هستند که انویدیا با اجاره دادن آن‌ها به مشتریان نهایی به آن‌ها می‌فروشد: طراح تراشه گفت که به ازای هر دلاری که یک ارائه‌دهنده ابر برای خرید یک پردازنده گرافیکی هزینه می‌کند، پنج دلار به آن‌ها برمی‌گردد. دلار در چهار سال در تئوری، انویدیا می‌تواند واسطه‌ها را حذف کند و به سادگیGPU‌ها را از طریق سرویس ابری خود ارائه دهد و تمام سود را از آن خود کند. اما فراتر از نگرانی‌های نظارتی، این خطر می‌تواند بزرگترین مشتریان خود را به‌طور کامل از بین ببرد و ده‌ها میلیارد دلار هزینه برای راه‌اندازی و راه‌اندازی آن خواهد داشت. این شرکت در عوض در تلاش است تا گزینه سوم ایجاد کند: یک ابر در فضای ابری.

سال گذشته، انویدیا «DGX Cloud» را معرفی کرد، سرویسی که در بالای پلتفرم‌های ابری شرکت‌های دیگر ارائه می‌شود. ارائه‌دهندگان فضای ابری سرورهای انویدیا را اجاره می‌کنند و آن‌ها را به عنوان ابری استفاده می‌کنند که انویدیا می‌تواند آن‌ها را بازاریابی و به شرکت‌هایی که به دنبال ابررایانه‌هایی با پردازنده گرافیکی بزرگ هستند بفروشد.

گوگل، مایکروسافت و اوراکل از همان ابتدا با این پیشنهاد موافقت کردند، اما AWS تا دسامبر ادامه داد و سرانجام از کار افتاد. هیپراسکیلزرها چیزی در مورد معامله دقیق نگفته‌اند و هیچ‌کس این سرویس را در وب سایت خود تبلیغ نمی‌کند.

در عوض، DGX Cloud  را می‌توان راهی برای انویدیا در نظر گرفت تا از تقاضای ناامیدکننده برای پردازنده‌های گرافیکی خود به عنوان راهی برای ایجاد فضایی در فضای ابری استفاده کند و از موقعیت خود در بازار برای جذب برخی از درآمدهای خدمات و توسعه روابط مستقیم با بازار استفاده کند. کاربران نهایی الکسیس بیورلین، مدیر DGX Cloud و معاون سابق زیرساخت متا، به DCD می گوید: «اصلاً آن را اسب تروا نمی‌نامم.

او بارها در طول مصاحبه می‌گوید: «این یک مشارکت عمیق است. «کاری که ما انجام می‌دهیم این است که به طور گسترده با ارائه دهندگان خدمات ابری [CSP] کار می کنیم.»

انویدیا در گزارش درآمد ماه مه ۲۰۲۴ خود اعلام کرد که متعهد شده است در چند سال آینده حداقل ۹ میلیارد دلار برای خدمات رایانش ابری هزینه کند، در حالی که در ژانویه ۵/۴ میلیارد دلار تعهد کرده بود. این رقم شامل DGX Cloud است که نشان دهنده گسترش سریع تلاش است.

Bjorlin می‌گوید: « DGX Cloud  به همه ارائه دهندگان خدمات ارتباطی (CSP) فرصت دسترسی به آخرین فناوری انویدیا را ارائه می‌دهد. «اگر ما یک قدم به عقب برداریم و به تجربه کاربر نهایی فکر کنیم، یک قابلیت کامل داریم.»

به جای تلاش انویدیا برای ایجاد یک کسب و کار ابری، Bjorlin  می‌گوید که هدف DGX Cloud ارائه «تجربه انتها به انتها» بود. ما یک پلتفرم کامل به عنوان یک مجموعه نرم‌افزاری خدماتی داریم، ما خدمات ریخته‌گری هوش مصنوعی را ارائه می‌دهیم.

او می‌افزاید: «بسیاری از مشتریان ما می‌خواهند نرم‌افزار و مهارت‌های AI/ML خود را در توسعه اپلیکیشن سرمایه‌گذاری کنند، نه لزوماً زیرساخت‌های زیربنایی که ممکن است به عنوان عنصری از ارائه‌دهنده ابر فکر کنید، بلکه در زیرساخت‌های هوش مصنوعی مدیریت کنند.

من فکر می‌کنم اینجا جایی است که DGX Cloud چیزی منحصر به فرد و متفاوت را ارائه می‌کند: ما مشتریان را در هر کجای سفرشان که هستند به دست می‌آوریم.

 

 

او می‌گوید: «مشتریان به همه کارشناسان داخلی انویدیا که در زمینه بهینه‌سازی مدل، بهینه‌سازی زمان اجرا یا هر چیز دیگری در اختیار داریم، دسترسی خواهند داشت». من فکر می‌کنم مردم به دنبال چیزی هستند که مصرف آن کمی ساده‌تر باشد تا بتوانند به جای یک مرکز هزینه، روی توسعه برنامه‌های کاربردی درآمدزای خود تمرکز کنند.» این مشتریان به انویدیا می‌آیند و قیمت‌های تعیین شده توسط شرکت را پرداخت می‌کنند، حتی اگر سخت افزار اصلی در مراکز داده CSP اجرا شود.

CSP  هنوز مهم است زیرا مشتری اغلب از یکی برای خدمات غیر DGX استفاده می‌کند. بجورلین می‌گوید: «معمولاً، مشتریان با نظرات بسیار واضح وارد می‌شوند. «آن‌ها داده‌های خود را در جایی دارند و گرانش داده یک جنبه مهم در اینجا است. بله، نرخ خروج در حال کاهش یا کاهش اس..»

Bjorlin  در مورد ورودی Nvidia در مورد توصیه به مشتریان CSP کمی گیج است: «ما توصیه نمی‌کنیم از کدام ابر استفاده کنیم، اما می‌توانیم جایی که فکر می‌کنیم عملکرد به حداکثر می‌رسد را به اشتراک بگذاریم.»

این شرکت با هر CSP کار می‌کند تا نسخه خود را از DGX Cloud ایجاد کند که گاهی اوقات دارای ویژگی‌های منحصربه‌فرد است.

Bjorlin  می‌گوید: «با AWS، ما اعلام کردیم که با [شبکه‌های] EFA و سیستم Nitro آن‌ها کار خواهیم کرد. این شرکت قصد دارد ۱۶۳۸۴ پردازنده گرافیکی را برای DGX Cloud و همچنین هزاران واحد دیگر را مستقیماً از طریق AWS مستقر کند.

تعادل بین فناوری ابر و انویدیا

او استدلال می‌کند که این برای توسعه آینده هوش مصنوعی ضروری است. یک مدل می تواند تغییر کند. تغییر به ترکیبی از متخصصان، استرس‌های متفاوتی را بر شبکه وارد می‌کند و عملکرد بارهای کاری را تغییر می‌دهد.

DGX Cloud  واقعاً تلاش می‌کند تا مجموعه وسیع‌تری از حوزه‌هایی را که هوش مصنوعی در آن‌ها تکامل می‌یابد، درک کند، تا مطمئن شود که ما برای آن طراحی می‌کنیم، به طوری که در نهایت پردازنده‌های گرافیکی Nvidia نقطه فرود نهایی برای هر یک از این بارهای کاری هوش مصنوعی باشند.»

منابع مطلب : datacenterdynamics

آیا این مطلب برای شما مفید بود؟


0 بازخورد

نظرات کاربران


آبگینه پرداز شرق