Alex Yeh، بنیانگذار و مدیر عامل GMI Cloud - Series Interview

الکس یه موسس و مدیر عامل شرکت GMI Cloud، یک شرکت زیرساخت دیجیتال با پشتوانه سرمایه گذاری با ماموریت توانمندسازی هر کسی برای استقرار بی دردسر هوش مصنوعی و ساده کردن نحوه ساخت، استقرار و مقیاس هوش مصنوعی توسط مشاغل از طریق راه حل های سخت افزاری و نرم افزاری یکپارچه

چه چیزی الهام بخش شما برای راه اندازی GMI Cloud شد و سابقه شما چگونه روی رویکرد شما برای ساخت شرکت تأثیر گذاشته است؟

GMI Cloud در سال 2021 تاسیس شد و در دو سال اول خود بر روی ساخت و راه اندازی مراکز داده برای ارائه گره های محاسباتی بیت کوین تمرکز داشت. در این مدت، ما سه مرکز داده در آرکانزاس و تگزاس ایجاد کردیم.

در ژوئن سال گذشته، ما متوجه تقاضای شدید سرمایه گذاران و مشتریان برای قدرت محاسباتی GPU شدیم. در عرض یک ماه، او تصمیم گرفت که به سمت زیرساخت ابری هوش مصنوعی حرکت کند. توسعه سریع هوش مصنوعی و موج فرصت‌های تجاری جدیدی که به ارمغان می‌آورد، پیش‌بینی یا غیرممکن است یا توصیف آن دشوار است. هدف GMI Cloud با فراهم کردن زیرساخت‌های ضروری این است که با فرصت‌های هیجان‌انگیز و اغلب غیرقابل تصور در هوش مصنوعی هماهنگی نزدیکی داشته باشد.

قبل از GMI Cloud، من شریک یک شرکت سرمایه گذاری خطرپذیر بودم و به طور منظم با صنایع نوظهور درگیر بودم. من هوش مصنوعی را به عنوان آخرین «هوش طلا» قرن بیست و یکم می‌دانم، با پردازنده‌های گرافیکی و سرورهای هوش مصنوعی به‌عنوان «کلنگ» برای «کاوش‌گران» امروزی عمل می‌کنند و باعث رشد سریع شرکت‌های ابری متخصص در اجاره قدرت پردازش گرافیکی می‌شوند.

آیا می‌توانید در مورد مأموریت GMI Cloud برای ساده‌سازی زیرساخت‌های هوش مصنوعی و اینکه چرا این تمرکز در بازار امروز بسیار مهم است، بگویید؟

ساده‌سازی زیرساخت‌های هوش مصنوعی به دلیل پیچیدگی و تکه تکه شدن پشته هوش مصنوعی ضروری است، که می‌تواند دسترسی و کارایی را برای مشاغلی که قصد دارند از پتانسیل هوش مصنوعی استفاده کنند، محدود کند. راه‌اندازی‌های هوش مصنوعی امروزی اغلب شامل چندین لایه جدا از هم هستند – از پیش‌پردازش داده‌ها و آموزش مدل گرفته تا استقرار و مقیاس‌گذاری – که برای مدیریت مؤثر به زمان، مهارت‌های تخصصی و منابع قابل توجهی نیاز دارند. بسیاری از شرکت‌ها هفته‌ها و حتی ماه‌ها را صرف شناسایی بهترین لایه‌های زیرساخت هوش مصنوعی می‌کنند، فرآیندی که می‌تواند تا هفته‌ها یا حتی ماه‌ها ادامه یابد و بر تجربه و بهره‌وری کاربر تأثیر بگذارد.

تسریع در استقرار: زیرساخت ساده‌شده، توسعه و استقرار سریع‌تر راه‌حل‌های هوش مصنوعی را امکان‌پذیر می‌کند و به شرکت‌ها کمک می‌کند تا رقابتی و سازگار با نیازهای متغیر بازار باقی بمانند.
کاهش هزینه ها و کاهش منابع: با به حداقل رساندن نیاز به سخت افزار تخصصی و ادغام های سفارشی، یک پشته هوش مصنوعی ساده می تواند هزینه ها را به میزان قابل توجهی کاهش دهد و هوش مصنوعی را به ویژه برای مشاغل کوچکتر در دسترس تر کند.
فعال کردن مقیاس پذیری: یک زیرساخت به خوبی یکپارچه امکان مدیریت کارآمد منابع را فراهم می‌کند، که برای مقیاس‌بندی برنامه‌ها با افزایش تقاضا ضروری است و تضمین می‌کند که راه‌حل‌های هوش مصنوعی در مقیاس‌های بزرگ‌تر قوی و پاسخ‌گو باقی می‌مانند.
بهبود دسترسی: زیرساخت های ساده، پذیرش هوش مصنوعی را برای طیف وسیع تری از سازمان ها بدون نیاز به تخصص فنی گسترده آسان تر می کند. این دموکراتیزه کردن هوش مصنوعی باعث ترویج نوآوری و ایجاد ارزش در صنایع بیشتر می شود.
حمایت از نوآوری سریع: با پیشرفت فناوری هوش مصنوعی، زیرساخت‌های پیچیده کمتر، ترکیب ابزارها، مدل‌ها و روش‌های جدید را آسان‌تر می‌کند و به سازمان‌ها اجازه می‌دهد تا چابک بمانند و به سرعت نوآوری کنند.

ماموریت GMI Cloud برای ساده‌سازی زیرساخت‌های هوش مصنوعی برای کمک به شرکت‌ها و استارت‌آپ‌ها برای درک کامل مزایای هوش مصنوعی ضروری است و آن را برای سازمان‌هایی در هر اندازه‌ای قابل دسترس، مقرون‌به‌صرفه و مقیاس‌پذیر می‌کند.

شما اخیراً ایمن شده اید بودجه 82 میلیون دلاری سری A. این سرمایه جدید چگونه استفاده خواهد شد و اهداف توسعه فوری شما چیست؟

GMI Cloud از این بودجه برای افتتاح یک مرکز داده جدید در کلرادو استفاده خواهد کرد و در درجه اول بر روی پردازنده‌های گرافیکی H200 سرمایه‌گذاری خواهد کرد تا یک کلاستر گرافیکی در مقیاس بزرگ بسازد. GMI Cloud همچنین به طور فعال در حال توسعه پلت فرم مدیریت منابع بومی ابری خود، Cluster Engine است که به طور یکپارچه با سخت افزار پیشرفته ما ادغام شده است. این پلتفرم قابلیت های بی نظیری در مجازی سازی، کانتینری سازی و ارکستراسیون ارائه می دهد.

GMI Cloud دسترسی به GPU را با سرعت 2 برابر در مقایسه با رقبا ارائه می دهد. چه رویکردها یا فناوری های منحصر به فردی این امکان را فراهم می کند؟

یکی از جنبه‌های کلیدی رویکرد منحصربه‌فرد GMI Cloud، بهره‌برداری از NCP NVIDIA است که دسترسی اولویت‌دار GMI Cloud به GPU و سایر منابع پیشرفته را فراهم می‌کند. این خرید مستقیم از تولیدکنندگان، همراه با گزینه های تامین مالی قوی، کارایی هزینه و زنجیره تامین بسیار ایمن را تضمین می کند.

با وجود پردازنده‌های گرافیکی NVIDIA H100 در پنج مکان جهانی، این زیرساخت چگونه از نیازهای مشتریان هوش مصنوعی شما در ایالات متحده و آسیا پشتیبانی می‌کند؟

GMI Cloud با شبکه ای از IDCها (مراکز داده های اینترنتی) در سراسر جهان، به طور استراتژیک یک حضور جهانی ایجاد کرده است و به چندین کشور و منطقه از جمله تایوان، ایالات متحده و تایلند خدمات ارائه می دهد. در حال حاضر، GMI Cloud هزاران کارت گرافیک مبتنی بر NVIDIA Hopper را اداره می‌کند و در مسیر توسعه سریع قرار دارد و برنامه‌هایی برای چند برابر کردن منابع خود در شش ماه آینده دارد. این توزیع جغرافیایی به GMI Cloud اجازه می‌دهد تا خدمات یکپارچه و با تأخیر کم را به مشتریان در مناطق مختلف ارائه دهد، کارایی انتقال داده‌ها را بهینه کرده و پشتیبانی زیرساختی قوی را برای شرکت‌هایی که عملیات هوش مصنوعی خود را در سراسر جهان گسترش می‌دهند، ارائه دهد.

به‌علاوه، قابلیت‌های جهانی GMI Cloud آن را قادر می‌سازد تا خواسته‌های بازار و الزامات نظارتی مختلف را در مناطق مختلف درک کرده و برآورده کند، و راه‌حل‌های سفارشی‌سازی شده متناسب با نیازهای منحصربه‌فرد هر منطقه را ارائه دهد. با افزایش منابع محاسباتی، GMI Cloud به تقاضای فزاینده برای قدرت محاسباتی هوش مصنوعی می‌پردازد و به مشتریان ظرفیت محاسباتی کافی برای تسریع آموزش مدل، افزایش دقت و بهبود عملکرد مدل برای طیف گسترده‌ای از پروژه‌های هوش مصنوعی ارائه می‌دهد.

به عنوان پیشرو در خدمات ابری بومی هوش مصنوعی، برای پیشبرد فناوری GMI روی چه روندها یا نیازهای مشتری تمرکز می کنید؟

از پردازنده‌های گرافیکی گرفته تا برنامه‌های کاربردی، GMI Cloud تحولی هوشمندانه را برای مشتریان ایجاد می‌کند و نیازهای توسعه فناوری هوش مصنوعی را برآورده می‌کند.

معماری سخت افزار:

معماری خوشه فیزیکی: نمونه‌هایی مانند 1250 H100 شامل قفسه‌های GPU، قفسه‌های برگ، و پایه‌های پایه، با پیکربندی‌های بهینه‌شده سرورها و تجهیزات شبکه هستند که قدرت محاسباتی با کارایی بالا را ارائه می‌کنند.
ساختار توپولوژی شبکه: طراحی شده با پارچه کارآمد IB و پارچه اترنت، انتقال و ارتباطات روان را تضمین می کند.

نرم افزار و خدمات:

موتور خوشه: استفاده از یک موتور توسعه یافته داخلی برای مدیریت منابعی مانند فلز خالی، Kubernetes/ظروف، و HPC Slurm، امکان تخصیص بهینه منابع را برای کاربران و مدیران فراهم می کند.
پلتفرم ابر اختصاصی: CLUSTER ENGINE یک سیستم مدیریت ابر اختصاصی است که زمان بندی منابع را بهینه می کند و یک راه حل مدیریت خوشه انعطاف پذیر و کارآمد را ارائه می دهد.

نقشه راه موتور استنتاج را اضافه کنید:

محاسبات مداوم، تضمین SLA بالا.
اشتراک زمان برای استفاده از زمان کسری.
نمونه نقطه ای

مشاوره و خدمات سفارشی: خدمات مشاوره، گزارش دهی و سفارشی سازی شده مانند کانتینرسازی، توصیه های آموزشی مدل و پلتفرم های MLOps مناسب را ارائه می دهد.

ویژگی های امنیتی و مانیتورینگ قوی: شامل کنترل دسترسی مبتنی بر نقش (RBAC)، مدیریت گروه کاربر، نظارت در زمان واقعی، ردیابی تاریخی و اعلان‌های هشدار است.

به نظر شما، برخی از بزرگترین چالش ها و فرصت ها برای زیرساخت های هوش مصنوعی در چند سال آینده چیست؟

چالش ها:

مقیاس پذیری و هزینه ها: همانطور که مدل ها پیچیده تر می شوند، حفظ مقیاس پذیری و مقرون به صرفه بودن به یک چالش، به ویژه برای شرکت های کوچکتر تبدیل می شود.
انرژی و پایداری: مصرف انرژی بالا نیازمند راه حل های سازگار با محیط زیست با افزایش پذیرش هوش مصنوعی است.
امنیت و حریم خصوصی: حفاظت از داده ها در زیرساخت های مشترک نیازمند امنیت در حال تکامل و انطباق با مقررات است.
قابلیت همکاری: ابزارهای تکه تکه شده در پشته هوش مصنوعی استقرار و یکپارچه سازی یکپارچه را پیچیده می کند. استقرار هر هوش مصنوعی را در حقیقت پیچیده می کند. اکنون می‌توانیم زمان توسعه را 2 برابر کاهش دهیم و تعداد کارمندان یک پروژه هوش مصنوعی را تا 3 برابر کاهش دهیم.

فرصت ها:

Edge AI Growth: پردازش هوش مصنوعی نزدیکتر به منابع داده، کاهش تأخیر و حفظ پهنای باند را ارائه می دهد.
MLO های خودکار: عملیات ساده پیچیدگی استقرار را کاهش می دهد و به شرکت ها اجازه می دهد بر روی برنامه ها تمرکز کنند.
سخت افزار انرژی کارآمد: نوآوری ها می توانند دسترسی را بهبود بخشند و اثرات زیست محیطی را کاهش دهند.
ابر هیبریدی: زیرساختی که در محیط‌های ابری و on-prem عمل می‌کند، برای انعطاف‌پذیری سازمانی مناسب است.
مدیریت مبتنی بر هوش مصنوعی: استفاده از هوش مصنوعی برای بهینه سازی خودکار زیرساخت ها، زمان خرابی را کاهش می دهد و کارایی را افزایش می دهد.

آیا می توانید بینش هایی را در مورد چشم انداز بلند مدت خود برای GMI Cloud به اشتراک بگذارید؟ به نظر شما چه نقشی در تکامل هوش مصنوعی و AGI ایفا می کند؟

من می خواهم هوش مصنوعی اینترنت را بسازم. من می خواهم زیرساختی بسازم که آینده را در سرتاسر جهان تقویت کند.

برای ایجاد یک پلتفرم در دسترس، مشابه Squarespace یا Wix، اما برای هوش مصنوعی. هر کسی باید بتواند اپلیکیشن هوش مصنوعی خود را بسازد.

در سال های آینده، هوش مصنوعی شاهد رشد قابل توجهی خواهد بود، به ویژه با موارد استفاده مولد از هوش مصنوعی، زیرا صنایع بیشتری این فناوری ها را برای افزایش خلاقیت، خودکارسازی فرآیندها و بهینه سازی تصمیم گیری ادغام می کنند. استنتاج نقش اصلی را در این آینده ایفا می کند و برنامه های کاربردی هوش مصنوعی را قادر می سازد تا کارهای پیچیده را به طور موثر و در مقیاس انجام دهند. انتظار می‌رود موارد استفاده از تجارت به کسب و کار (B2B) با تمرکز فزاینده شرکت‌ها بر روی استفاده از هوش مصنوعی برای افزایش بهره‌وری، ساده‌سازی عملیات و ایجاد ارزش جدید غالب شود. چشم‌انداز بلندمدت GMI Cloud با این روند مطابقت دارد و هدف آن ارائه زیرساخت‌های پیشرفته و قابل اعتماد است که از شرکت‌ها در به حداکثر رساندن بهره‌وری و تأثیر هوش مصنوعی در سازمان‌هایشان پشتیبانی می‌کند.

در حالی که عملیات خود را با مرکز داده جدید در کلرادو افزایش می دهید، در سال آینده به چه اهداف یا نقاط عطفی استراتژیک می خواهید برسید؟

همانطور که عملیات را با مرکز داده جدید در کلرادو مقیاس بندی می کنیم، بر روی چندین هدف استراتژیک و نقاط عطف در سال آینده تمرکز می کنیم. ایالات متحده به عنوان بزرگترین بازار برای هوش مصنوعی و محاسبات AI می باشد و حضور قوی در این منطقه را برای ما ضروری می سازد. موقعیت استراتژیک کلرادو، همراه با اکوسیستم فن‌آوری قوی و محیط کسب‌وکار مطلوب، ما را در خدمت بهتر به پایگاه مشتریان رو به رشد و ارتقای خدمات خود قرار می‌دهد.

چه توصیه ای به شرکت ها یا استارت آپ هایی که به دنبال استفاده از زیرساخت های پیشرفته هوش مصنوعی هستند می دهید؟

برای استارت‌آپ‌هایی که بر نوآوری مبتنی بر هوش مصنوعی متمرکز هستند، اولویت باید روی ساخت و اصلاح محصولاتشان باشد، نه صرف زمان ارزشمند برای مدیریت زیرساخت. با ارائه‌دهندگان فناوری قابل اعتمادی که راه‌حل‌های GPU قابل اعتماد و مقیاس‌پذیر را ارائه می‌کنند، شریک شوید، از ارائه‌دهندگانی که با جایگزین‌های دارای برچسب سفید، گوشه‌ها را کوتاه می‌کنند، اجتناب کنید. قابلیت اطمینان و استقرار سریع بسیار مهم است. در مراحل اولیه، سرعت اغلب تنها راه رقابتی است که یک استارتاپ در برابر بازیکنان مستقر دارد. گزینه‌های منعطف و مبتنی بر ابر را انتخاب کنید که از رشد پشتیبانی می‌کنند و بدون به خطر انداختن چابکی، بر امنیت و انطباق تمرکز کنید. با انجام این کار، استارت‌آپ‌ها می‌توانند به آرامی ادغام شوند، سریع تکرار شوند و منابع خود را به سمت آنچه واقعاً مهم است هدایت کنند – ارائه یک محصول برجسته در بازار.

با تشکر از شما برای مصاحبه عالی، خوانندگانی که مایل به کسب اطلاعات بیشتر هستند باید از آن بازدید کنند GMI Cloud،