الکس یه موسس و مدیر عامل شرکت GMI Cloud، یک شرکت زیرساخت دیجیتال با پشتوانه سرمایه گذاری با ماموریت توانمندسازی هر کسی برای استقرار بی دردسر هوش مصنوعی و ساده کردن نحوه ساخت، استقرار و مقیاس هوش مصنوعی توسط مشاغل از طریق راه حل های سخت افزاری و نرم افزاری یکپارچه
چه چیزی الهام بخش شما برای راه اندازی GMI Cloud شد و سابقه شما چگونه روی رویکرد شما برای ساخت شرکت تأثیر گذاشته است؟
GMI Cloud در سال 2021 تاسیس شد و در دو سال اول خود بر روی ساخت و راه اندازی مراکز داده برای ارائه گره های محاسباتی بیت کوین تمرکز داشت. در این مدت، ما سه مرکز داده در آرکانزاس و تگزاس ایجاد کردیم.
در ژوئن سال گذشته، ما متوجه تقاضای شدید سرمایه گذاران و مشتریان برای قدرت محاسباتی GPU شدیم. در عرض یک ماه، او تصمیم گرفت که به سمت زیرساخت ابری هوش مصنوعی حرکت کند. توسعه سریع هوش مصنوعی و موج فرصتهای تجاری جدیدی که به ارمغان میآورد، پیشبینی یا غیرممکن است یا توصیف آن دشوار است. هدف GMI Cloud با فراهم کردن زیرساختهای ضروری این است که با فرصتهای هیجانانگیز و اغلب غیرقابل تصور در هوش مصنوعی هماهنگی نزدیکی داشته باشد.
قبل از GMI Cloud، من شریک یک شرکت سرمایه گذاری خطرپذیر بودم و به طور منظم با صنایع نوظهور درگیر بودم. من هوش مصنوعی را به عنوان آخرین «هوش طلا» قرن بیست و یکم میدانم، با پردازندههای گرافیکی و سرورهای هوش مصنوعی بهعنوان «کلنگ» برای «کاوشگران» امروزی عمل میکنند و باعث رشد سریع شرکتهای ابری متخصص در اجاره قدرت پردازش گرافیکی میشوند.
آیا میتوانید در مورد مأموریت GMI Cloud برای سادهسازی زیرساختهای هوش مصنوعی و اینکه چرا این تمرکز در بازار امروز بسیار مهم است، بگویید؟
سادهسازی زیرساختهای هوش مصنوعی به دلیل پیچیدگی و تکه تکه شدن پشته هوش مصنوعی ضروری است، که میتواند دسترسی و کارایی را برای مشاغلی که قصد دارند از پتانسیل هوش مصنوعی استفاده کنند، محدود کند. راهاندازیهای هوش مصنوعی امروزی اغلب شامل چندین لایه جدا از هم هستند – از پیشپردازش دادهها و آموزش مدل گرفته تا استقرار و مقیاسگذاری – که برای مدیریت مؤثر به زمان، مهارتهای تخصصی و منابع قابل توجهی نیاز دارند. بسیاری از شرکتها هفتهها و حتی ماهها را صرف شناسایی بهترین لایههای زیرساخت هوش مصنوعی میکنند، فرآیندی که میتواند تا هفتهها یا حتی ماهها ادامه یابد و بر تجربه و بهرهوری کاربر تأثیر بگذارد.
- تسریع در استقرار: زیرساخت سادهشده، توسعه و استقرار سریعتر راهحلهای هوش مصنوعی را امکانپذیر میکند و به شرکتها کمک میکند تا رقابتی و سازگار با نیازهای متغیر بازار باقی بمانند.
- کاهش هزینه ها و کاهش منابع: با به حداقل رساندن نیاز به سخت افزار تخصصی و ادغام های سفارشی، یک پشته هوش مصنوعی ساده می تواند هزینه ها را به میزان قابل توجهی کاهش دهد و هوش مصنوعی را به ویژه برای مشاغل کوچکتر در دسترس تر کند.
- فعال کردن مقیاس پذیری: یک زیرساخت به خوبی یکپارچه امکان مدیریت کارآمد منابع را فراهم میکند، که برای مقیاسبندی برنامهها با افزایش تقاضا ضروری است و تضمین میکند که راهحلهای هوش مصنوعی در مقیاسهای بزرگتر قوی و پاسخگو باقی میمانند.
- بهبود دسترسی: زیرساخت های ساده، پذیرش هوش مصنوعی را برای طیف وسیع تری از سازمان ها بدون نیاز به تخصص فنی گسترده آسان تر می کند. این دموکراتیزه کردن هوش مصنوعی باعث ترویج نوآوری و ایجاد ارزش در صنایع بیشتر می شود.
- حمایت از نوآوری سریع: با پیشرفت فناوری هوش مصنوعی، زیرساختهای پیچیده کمتر، ترکیب ابزارها، مدلها و روشهای جدید را آسانتر میکند و به سازمانها اجازه میدهد تا چابک بمانند و به سرعت نوآوری کنند.
ماموریت GMI Cloud برای سادهسازی زیرساختهای هوش مصنوعی برای کمک به شرکتها و استارتآپها برای درک کامل مزایای هوش مصنوعی ضروری است و آن را برای سازمانهایی در هر اندازهای قابل دسترس، مقرونبهصرفه و مقیاسپذیر میکند.
شما اخیراً ایمن شده اید بودجه 82 میلیون دلاری سری A. این سرمایه جدید چگونه استفاده خواهد شد و اهداف توسعه فوری شما چیست؟
GMI Cloud از این بودجه برای افتتاح یک مرکز داده جدید در کلرادو استفاده خواهد کرد و در درجه اول بر روی پردازندههای گرافیکی H200 سرمایهگذاری خواهد کرد تا یک کلاستر گرافیکی در مقیاس بزرگ بسازد. GMI Cloud همچنین به طور فعال در حال توسعه پلت فرم مدیریت منابع بومی ابری خود، Cluster Engine است که به طور یکپارچه با سخت افزار پیشرفته ما ادغام شده است. این پلتفرم قابلیت های بی نظیری در مجازی سازی، کانتینری سازی و ارکستراسیون ارائه می دهد.
GMI Cloud دسترسی به GPU را با سرعت 2 برابر در مقایسه با رقبا ارائه می دهد. چه رویکردها یا فناوری های منحصر به فردی این امکان را فراهم می کند؟
یکی از جنبههای کلیدی رویکرد منحصربهفرد GMI Cloud، بهرهبرداری از NCP NVIDIA است که دسترسی اولویتدار GMI Cloud به GPU و سایر منابع پیشرفته را فراهم میکند. این خرید مستقیم از تولیدکنندگان، همراه با گزینه های تامین مالی قوی، کارایی هزینه و زنجیره تامین بسیار ایمن را تضمین می کند.
با وجود پردازندههای گرافیکی NVIDIA H100 در پنج مکان جهانی، این زیرساخت چگونه از نیازهای مشتریان هوش مصنوعی شما در ایالات متحده و آسیا پشتیبانی میکند؟
GMI Cloud با شبکه ای از IDCها (مراکز داده های اینترنتی) در سراسر جهان، به طور استراتژیک یک حضور جهانی ایجاد کرده است و به چندین کشور و منطقه از جمله تایوان، ایالات متحده و تایلند خدمات ارائه می دهد. در حال حاضر، GMI Cloud هزاران کارت گرافیک مبتنی بر NVIDIA Hopper را اداره میکند و در مسیر توسعه سریع قرار دارد و برنامههایی برای چند برابر کردن منابع خود در شش ماه آینده دارد. این توزیع جغرافیایی به GMI Cloud اجازه میدهد تا خدمات یکپارچه و با تأخیر کم را به مشتریان در مناطق مختلف ارائه دهد، کارایی انتقال دادهها را بهینه کرده و پشتیبانی زیرساختی قوی را برای شرکتهایی که عملیات هوش مصنوعی خود را در سراسر جهان گسترش میدهند، ارائه دهد.
بهعلاوه، قابلیتهای جهانی GMI Cloud آن را قادر میسازد تا خواستههای بازار و الزامات نظارتی مختلف را در مناطق مختلف درک کرده و برآورده کند، و راهحلهای سفارشیسازی شده متناسب با نیازهای منحصربهفرد هر منطقه را ارائه دهد. با افزایش منابع محاسباتی، GMI Cloud به تقاضای فزاینده برای قدرت محاسباتی هوش مصنوعی میپردازد و به مشتریان ظرفیت محاسباتی کافی برای تسریع آموزش مدل، افزایش دقت و بهبود عملکرد مدل برای طیف گستردهای از پروژههای هوش مصنوعی ارائه میدهد.
به عنوان پیشرو در خدمات ابری بومی هوش مصنوعی، برای پیشبرد فناوری GMI روی چه روندها یا نیازهای مشتری تمرکز می کنید؟
از پردازندههای گرافیکی گرفته تا برنامههای کاربردی، GMI Cloud تحولی هوشمندانه را برای مشتریان ایجاد میکند و نیازهای توسعه فناوری هوش مصنوعی را برآورده میکند.
معماری سخت افزار:
- معماری خوشه فیزیکی: نمونههایی مانند 1250 H100 شامل قفسههای GPU، قفسههای برگ، و پایههای پایه، با پیکربندیهای بهینهشده سرورها و تجهیزات شبکه هستند که قدرت محاسباتی با کارایی بالا را ارائه میکنند.
- ساختار توپولوژی شبکه: طراحی شده با پارچه کارآمد IB و پارچه اترنت، انتقال و ارتباطات روان را تضمین می کند.
نرم افزار و خدمات:
- موتور خوشه: استفاده از یک موتور توسعه یافته داخلی برای مدیریت منابعی مانند فلز خالی، Kubernetes/ظروف، و HPC Slurm، امکان تخصیص بهینه منابع را برای کاربران و مدیران فراهم می کند.
- پلتفرم ابر اختصاصی: CLUSTER ENGINE یک سیستم مدیریت ابر اختصاصی است که زمان بندی منابع را بهینه می کند و یک راه حل مدیریت خوشه انعطاف پذیر و کارآمد را ارائه می دهد.
نقشه راه موتور استنتاج را اضافه کنید:
- محاسبات مداوم، تضمین SLA بالا.
- اشتراک زمان برای استفاده از زمان کسری.
- نمونه نقطه ای
مشاوره و خدمات سفارشی: خدمات مشاوره، گزارش دهی و سفارشی سازی شده مانند کانتینرسازی، توصیه های آموزشی مدل و پلتفرم های MLOps مناسب را ارائه می دهد.
ویژگی های امنیتی و مانیتورینگ قوی: شامل کنترل دسترسی مبتنی بر نقش (RBAC)، مدیریت گروه کاربر، نظارت در زمان واقعی، ردیابی تاریخی و اعلانهای هشدار است.
به نظر شما، برخی از بزرگترین چالش ها و فرصت ها برای زیرساخت های هوش مصنوعی در چند سال آینده چیست؟
چالش ها:
- مقیاس پذیری و هزینه ها: همانطور که مدل ها پیچیده تر می شوند، حفظ مقیاس پذیری و مقرون به صرفه بودن به یک چالش، به ویژه برای شرکت های کوچکتر تبدیل می شود.
- انرژی و پایداری: مصرف انرژی بالا نیازمند راه حل های سازگار با محیط زیست با افزایش پذیرش هوش مصنوعی است.
- امنیت و حریم خصوصی: حفاظت از داده ها در زیرساخت های مشترک نیازمند امنیت در حال تکامل و انطباق با مقررات است.
- قابلیت همکاری: ابزارهای تکه تکه شده در پشته هوش مصنوعی استقرار و یکپارچه سازی یکپارچه را پیچیده می کند. استقرار هر هوش مصنوعی را در حقیقت پیچیده می کند. اکنون میتوانیم زمان توسعه را 2 برابر کاهش دهیم و تعداد کارمندان یک پروژه هوش مصنوعی را تا 3 برابر کاهش دهیم.
فرصت ها:
- Edge AI Growth: پردازش هوش مصنوعی نزدیکتر به منابع داده، کاهش تأخیر و حفظ پهنای باند را ارائه می دهد.
- MLO های خودکار: عملیات ساده پیچیدگی استقرار را کاهش می دهد و به شرکت ها اجازه می دهد بر روی برنامه ها تمرکز کنند.
- سخت افزار انرژی کارآمد: نوآوری ها می توانند دسترسی را بهبود بخشند و اثرات زیست محیطی را کاهش دهند.
- ابر هیبریدی: زیرساختی که در محیطهای ابری و on-prem عمل میکند، برای انعطافپذیری سازمانی مناسب است.
- مدیریت مبتنی بر هوش مصنوعی: استفاده از هوش مصنوعی برای بهینه سازی خودکار زیرساخت ها، زمان خرابی را کاهش می دهد و کارایی را افزایش می دهد.
آیا می توانید بینش هایی را در مورد چشم انداز بلند مدت خود برای GMI Cloud به اشتراک بگذارید؟ به نظر شما چه نقشی در تکامل هوش مصنوعی و AGI ایفا می کند؟
من می خواهم هوش مصنوعی اینترنت را بسازم. من می خواهم زیرساختی بسازم که آینده را در سرتاسر جهان تقویت کند.
برای ایجاد یک پلتفرم در دسترس، مشابه Squarespace یا Wix، اما برای هوش مصنوعی. هر کسی باید بتواند اپلیکیشن هوش مصنوعی خود را بسازد.
در سال های آینده، هوش مصنوعی شاهد رشد قابل توجهی خواهد بود، به ویژه با موارد استفاده مولد از هوش مصنوعی، زیرا صنایع بیشتری این فناوری ها را برای افزایش خلاقیت، خودکارسازی فرآیندها و بهینه سازی تصمیم گیری ادغام می کنند. استنتاج نقش اصلی را در این آینده ایفا می کند و برنامه های کاربردی هوش مصنوعی را قادر می سازد تا کارهای پیچیده را به طور موثر و در مقیاس انجام دهند. انتظار میرود موارد استفاده از تجارت به کسب و کار (B2B) با تمرکز فزاینده شرکتها بر روی استفاده از هوش مصنوعی برای افزایش بهرهوری، سادهسازی عملیات و ایجاد ارزش جدید غالب شود. چشمانداز بلندمدت GMI Cloud با این روند مطابقت دارد و هدف آن ارائه زیرساختهای پیشرفته و قابل اعتماد است که از شرکتها در به حداکثر رساندن بهرهوری و تأثیر هوش مصنوعی در سازمانهایشان پشتیبانی میکند.
در حالی که عملیات خود را با مرکز داده جدید در کلرادو افزایش می دهید، در سال آینده به چه اهداف یا نقاط عطفی استراتژیک می خواهید برسید؟
همانطور که عملیات را با مرکز داده جدید در کلرادو مقیاس بندی می کنیم، بر روی چندین هدف استراتژیک و نقاط عطف در سال آینده تمرکز می کنیم. ایالات متحده به عنوان بزرگترین بازار برای هوش مصنوعی و محاسبات AI می باشد و حضور قوی در این منطقه را برای ما ضروری می سازد. موقعیت استراتژیک کلرادو، همراه با اکوسیستم فنآوری قوی و محیط کسبوکار مطلوب، ما را در خدمت بهتر به پایگاه مشتریان رو به رشد و ارتقای خدمات خود قرار میدهد.
چه توصیه ای به شرکت ها یا استارت آپ هایی که به دنبال استفاده از زیرساخت های پیشرفته هوش مصنوعی هستند می دهید؟
برای استارتآپهایی که بر نوآوری مبتنی بر هوش مصنوعی متمرکز هستند، اولویت باید روی ساخت و اصلاح محصولاتشان باشد، نه صرف زمان ارزشمند برای مدیریت زیرساخت. با ارائهدهندگان فناوری قابل اعتمادی که راهحلهای GPU قابل اعتماد و مقیاسپذیر را ارائه میکنند، شریک شوید، از ارائهدهندگانی که با جایگزینهای دارای برچسب سفید، گوشهها را کوتاه میکنند، اجتناب کنید. قابلیت اطمینان و استقرار سریع بسیار مهم است. در مراحل اولیه، سرعت اغلب تنها راه رقابتی است که یک استارتاپ در برابر بازیکنان مستقر دارد. گزینههای منعطف و مبتنی بر ابر را انتخاب کنید که از رشد پشتیبانی میکنند و بدون به خطر انداختن چابکی، بر امنیت و انطباق تمرکز کنید. با انجام این کار، استارتآپها میتوانند به آرامی ادغام شوند، سریع تکرار شوند و منابع خود را به سمت آنچه واقعاً مهم است هدایت کنند – ارائه یک محصول برجسته در بازار.
با تشکر از شما برای مصاحبه عالی، خوانندگانی که مایل به کسب اطلاعات بیشتر هستند باید از آن بازدید کنند GMI Cloud،