تعادل انویدیا در فضای ابری
غول پردازنده گرافیکی شهرت و مقیاس دارد، اما یک هایپراسکیلر نیست. با وجود ارزش کمی بیش از ۳ تریلیون دلار، Nvidia عصبی است. رشد سریع سازنده GPU، یکی از با ارزشترین شرکتهای جهان، در دو سال گذشته بر پایههای متزلزلی بنا شده است: در حالی که تراشههای آن در قلب انقلاب هوش مصنوعی قرار دارند، ابر مقیاسکنندههایی که انویدیا به آنها به عنوان مهمترین آنها اعتماد میکند. مشتریان نیز بزرگترین رقبای آن هستند. خدمات وب آمازون، مایکروسافت و گوگل در تلاش برای صرفهجویی در هزینهها و یافتن یک مزیت منحصربهفرد، در حال توسعه تراشههای هوش مصنوعی خود هستند.
در همان زمان، همان شرکتهای ابری آماده کسب درآمد بیشتری از پردازندههای گرافیکی هستند که انویدیا با اجاره دادن آنها به مشتریان نهایی به آنها میفروشد: طراح تراشه گفت که به ازای هر دلاری که یک ارائهدهنده ابر برای خرید یک پردازنده گرافیکی هزینه میکند، پنج دلار به آنها برمیگردد. دلار در چهار سال در تئوری، انویدیا میتواند واسطهها را حذف کند و به سادگیGPUها را از طریق سرویس ابری خود ارائه دهد و تمام سود را از آن خود کند. اما فراتر از نگرانیهای نظارتی، این خطر میتواند بزرگترین مشتریان خود را بهطور کامل از بین ببرد و دهها میلیارد دلار هزینه برای راهاندازی و راهاندازی آن خواهد داشت. این شرکت در عوض در تلاش است تا گزینه سوم ایجاد کند: یک ابر در فضای ابری.
سال گذشته، انویدیا «DGX Cloud» را معرفی کرد، سرویسی که در بالای پلتفرمهای ابری شرکتهای دیگر ارائه میشود. ارائهدهندگان فضای ابری سرورهای انویدیا را اجاره میکنند و آنها را به عنوان ابری استفاده میکنند که انویدیا میتواند آنها را بازاریابی و به شرکتهایی که به دنبال ابررایانههایی با پردازنده گرافیکی بزرگ هستند بفروشد.
گوگل، مایکروسافت و اوراکل از همان ابتدا با این پیشنهاد موافقت کردند، اما AWS تا دسامبر ادامه داد و سرانجام از کار افتاد. هیپراسکیلزرها چیزی در مورد معامله دقیق نگفتهاند و هیچکس این سرویس را در وب سایت خود تبلیغ نمیکند.
در عوض، DGX Cloud را میتوان راهی برای انویدیا در نظر گرفت تا از تقاضای ناامیدکننده برای پردازندههای گرافیکی خود به عنوان راهی برای ایجاد فضایی در فضای ابری استفاده کند و از موقعیت خود در بازار برای جذب برخی از درآمدهای خدمات و توسعه روابط مستقیم با بازار استفاده کند. کاربران نهایی الکسیس بیورلین، مدیر DGX Cloud و معاون سابق زیرساخت متا، به DCD می گوید: «اصلاً آن را اسب تروا نمینامم.
او بارها در طول مصاحبه میگوید: «این یک مشارکت عمیق است. «کاری که ما انجام میدهیم این است که به طور گسترده با ارائه دهندگان خدمات ابری [CSP] کار می کنیم.»
انویدیا در گزارش درآمد ماه مه ۲۰۲۴ خود اعلام کرد که متعهد شده است در چند سال آینده حداقل ۹ میلیارد دلار برای خدمات رایانش ابری هزینه کند، در حالی که در ژانویه ۵/۴ میلیارد دلار تعهد کرده بود. این رقم شامل DGX Cloud است که نشان دهنده گسترش سریع تلاش است.
Bjorlin میگوید: « DGX Cloud به همه ارائه دهندگان خدمات ارتباطی (CSP) فرصت دسترسی به آخرین فناوری انویدیا را ارائه میدهد. «اگر ما یک قدم به عقب برداریم و به تجربه کاربر نهایی فکر کنیم، یک قابلیت کامل داریم.»
به جای تلاش انویدیا برای ایجاد یک کسب و کار ابری، Bjorlin میگوید که هدف DGX Cloud ارائه «تجربه انتها به انتها» بود. ما یک پلتفرم کامل به عنوان یک مجموعه نرمافزاری خدماتی داریم، ما خدمات ریختهگری هوش مصنوعی را ارائه میدهیم.
او میافزاید: «بسیاری از مشتریان ما میخواهند نرمافزار و مهارتهای AI/ML خود را در توسعه اپلیکیشن سرمایهگذاری کنند، نه لزوماً زیرساختهای زیربنایی که ممکن است به عنوان عنصری از ارائهدهنده ابر فکر کنید، بلکه در زیرساختهای هوش مصنوعی مدیریت کنند.
من فکر میکنم اینجا جایی است که DGX Cloud چیزی منحصر به فرد و متفاوت را ارائه میکند: ما مشتریان را در هر کجای سفرشان که هستند به دست میآوریم.
او میگوید: «مشتریان به همه کارشناسان داخلی انویدیا که در زمینه بهینهسازی مدل، بهینهسازی زمان اجرا یا هر چیز دیگری در اختیار داریم، دسترسی خواهند داشت». من فکر میکنم مردم به دنبال چیزی هستند که مصرف آن کمی سادهتر باشد تا بتوانند به جای یک مرکز هزینه، روی توسعه برنامههای کاربردی درآمدزای خود تمرکز کنند.» این مشتریان به انویدیا میآیند و قیمتهای تعیین شده توسط شرکت را پرداخت میکنند، حتی اگر سخت افزار اصلی در مراکز داده CSP اجرا شود.
CSP هنوز مهم است زیرا مشتری اغلب از یکی برای خدمات غیر DGX استفاده میکند. بجورلین میگوید: «معمولاً، مشتریان با نظرات بسیار واضح وارد میشوند. «آنها دادههای خود را در جایی دارند و گرانش داده یک جنبه مهم در اینجا است. بله، نرخ خروج در حال کاهش یا کاهش اس..»
Bjorlin در مورد ورودی Nvidia در مورد توصیه به مشتریان CSP کمی گیج است: «ما توصیه نمیکنیم از کدام ابر استفاده کنیم، اما میتوانیم جایی که فکر میکنیم عملکرد به حداکثر میرسد را به اشتراک بگذاریم.»
این شرکت با هر CSP کار میکند تا نسخه خود را از DGX Cloud ایجاد کند که گاهی اوقات دارای ویژگیهای منحصربهفرد است.
Bjorlin میگوید: «با AWS، ما اعلام کردیم که با [شبکههای] EFA و سیستم Nitro آنها کار خواهیم کرد. این شرکت قصد دارد ۱۶۳۸۴ پردازنده گرافیکی را برای DGX Cloud و همچنین هزاران واحد دیگر را مستقیماً از طریق AWS مستقر کند.
تعادل بین فناوری ابر و انویدیا
او استدلال میکند که این برای توسعه آینده هوش مصنوعی ضروری است. یک مدل می تواند تغییر کند. تغییر به ترکیبی از متخصصان، استرسهای متفاوتی را بر شبکه وارد میکند و عملکرد بارهای کاری را تغییر میدهد.
DGX Cloud واقعاً تلاش میکند تا مجموعه وسیعتری از حوزههایی را که هوش مصنوعی در آنها تکامل مییابد، درک کند، تا مطمئن شود که ما برای آن طراحی میکنیم، به طوری که در نهایت پردازندههای گرافیکی Nvidia نقطه فرود نهایی برای هر یک از این بارهای کاری هوش مصنوعی باشند.»
آیا این مطلب برای شما مفید بود؟
0 بازخورد