محمد ابو شیخ ، بنیانگذار و مدیرعامل CNTXT AI – سریال مصاحبه


محمد ابو شیخ در حال تغییر چشم انداز هوش مصنوعی در منطقه MENA است و باعث تغییر از مصرف منفعل به نوآوری حاکمیت می شود. به عنوان مدیرعامل CNTXT AI و بنیانگذار صندوق AI 10 میلیون دلاری ، وی سه خروجی موفق را رهبری کرده و بیش از یک میلیارد دلار بودجه تأمین کرده است. کار او پایه و اساس یک اکوسیستم هوش مصنوعی ریشه در زبان ، فرهنگ و حاکمیت داده ها است.

cntxt ai خدمات چرخه عمر ، از جمله تهیه داده ها ، توسعه مدل ، آزمایش و استقرار. پلتفرم آنها با تمرکز بر روی مدلهای زبان عربی ، از برنامه های هوش مصنوعی چند زبانه پشتیبانی می کند و بر حاکمیت داده ها و اوراق بهادار تأکید می کند

چه چیزی به شما الهام بخش است تا CNTXT AI را شروع کنید ، و دیدگاه شما برای Sovereign AI در دنیای عربی زبان چگونه آغاز شد؟

ما در این بخش از جهان به وفور داده های غیر مورد استفاده را دیدیم. بسیاری از مشکلات در مقیاس گذاری هوش مصنوعی ناشی از عدم آمادگی داده ها – که در نهایت به معنای عدم آمادگی هوش مصنوعی بود. به همین دلیل ما CNTXT AI را شروع کردیم.

در ابتدا ، ما در حال حل همان مشکلاتی بودیم که هنگام ساخت لوسی با آن روبرو شدیم … ما دیدیم که این چالش ها دست اول با AI71 ، TII و G42 (IIAI) کار می کنیم. از آنجا که ما به این نهادها کمک کردیم تا این مشکلات را حل کنند ، چشم انداز واضح تر شد و تجارت فقط در حال رشد بود.

شما در ساخت بزرگترین کتابخانه دیجیتال عربی برای آموزش هوش مصنوعی نقش اساسی داشته اید. برخی از بزرگترین چالش ها در انجام این کار چیست و چگونه بر آنها غلبه کردید؟

کیفیت یکی از بزرگترین چالش ها بود. مورد دیگر در دسترس بودن محدود داده های عربی با کیفیت بالا به صورت آنلاین بود: عربی به طور جدی کمتر نماینده است. تنها بخش کوچکی از محتوای زبان عربی دیجیتالی شده است ، و فقط 3-5 ٪ از کل محتوای آنلاین به زبان عربی است. این تقریباً هیچ چیز نیست. ما با استفاده از برچسب های داده ، حاشیه نویسی و دانشمندان داده برای دیجیتالی کردن ، ایجاد و اصلاح اطلاعات خودمان ، بر این مشکل غلبه کردیم.

CNTXT AI در تقاطع فرهنگ و محاسبه فعالیت می کند. چگونه می توانید نوآوری هوش مصنوعی برش را با هدف ایجاد راه حل های فرهنگی مرتبط برای منطقه MENA متعادل کنید؟

ما مدلهای زمینی را از زمین به بالا می سازیم. از زیرساخت ها تا محصول نهایی ، فرهنگ از همان ابتدا تعبیه شده است – این چیزی نیست که بعداً اضافه می کنیم. ما از روز اول با فرهنگ ها ، گویش ها و نیازهای خاص در ذهن خود طراحی ، نوآوری و ساختیم. عربی یک زبان است ، اما بسیاری از لهجه ها و زمینه های فرهنگی را در سراسر منطقه به همراه دارد ، بنابراین ما محصولات محلی را برای کشورهای محلی می سازیم. و ما این کار را با همکاری با حاشیه نویسان محلی ، مردم در زمین ، در کشورهای خود انجام می دهیم.

شما همچنین Locai را تأسیس کرده اید و صندوق SMPL AI را هدایت کرده اید. چگونه این سرمایه گذاری ها مأموریت CNTXT AI را تکمیل می کنند؟

Locai لایه برنامه است – بخشی که مردم در واقع با آنها ارتباط برقرار می کنند. درست در بالای داده ها و زیرساخت های ساخته شده توسط CNTXT AI قرار دارد. این همان چیزی است که باعث موفقیت آن شد: بنیادهای هوش مصنوعی ارائه شده توسط CNTXT AI را به راه حل های دنیای واقعی تبدیل می کند که مردم می توانند از آنها استفاده کنند.

از طرف دیگر SMPL AI در مورد بازگشت به جامعه است. این مرکز بر سرمایه گذاری در راه اندازی های اولیه و کمک به ساخت اکوسیستم منطقه ای هوش مصنوعی متمرکز است. ما ابزارها و درسهایی را که از ساخت خودمان آموخته ایم به اشتراک می گذاریم ، بنابراین بنیانگذاران می توانند سریعتر رشد کنند و از مشکلات مشترک جلوگیری کنند.

Munsit دقیق ترین الگوی تشخیص گفتار عربی در جهان خوانده شده است. چه چیزی باعث پیشرفت این مدل شد و چرا اکنون؟

آنچه توسعه این مدل را به وجود آورد ساده بود: نیاز.

ما همیشه از ضرورت می سازیم. ما به بازار نگاه کردیم و دیدیم که این چشم انداز رسیده است – آژانس های دولتی و مشتریان خصوصی همه درخواست راه حلی مانند این را داشتند.

مدل های موجود فقط به این کار نبودند. بیشتر آنها بر روی فناوری انگلیسی ساخته شده و سپس اقتباس شده اند. آنها برای عربی از زمین به بالا طراحی نشده اند ، و قطعاً برای مشکلات خاصی که ما حل می کنیم نیست.

بنابراین ما تصمیم گرفتیم که خودمان را بسازیم. این اولین عربی است – با طراحی.

تحقیقات در پشت Munsit یک رویکرد یادگیری ضعیف را ارائه می دهد. آیا می توانید توضیح دهید که این به چه معنی است و چرا برای آموزش ASR عربی در مقیاس ضروری است؟

حاشیه نویسی گران است. بنابراین ما مجبور شدیم فراتر از روشهای سنتی حرکت کنیم که به مقادیر زیادی رونویسی دستی بستگی دارد. یادگیری با نظارت ضعیف به ما کمک کرد بدون اینکه هر پرونده صوتی را با دست برچسب گذاری کنیم – که به ویژه برای عربی ، زبانی با داده های محدود و بسیاری از گویش های مختلف مهم است.

به جای استفاده از صوتی رونویسی حرفه ای ، ما با 30،000 ساعت گفتار عربی بدون برچسب شروع کردیم. ما یک خط لوله حاشیه نویسی ساختیم که با استفاده از چک های خودکار ، بهترین موارد را تولید ، فیلتر و تمیز می کند. این یک مجموعه داده با کیفیت بالا 15000 ساعته به ما داد-همه بدون رونویسی انسانی.

این رویکرد باعث شد تا مدل ما را از ابتدا آموزش دهد و غنای عربی گفتاری را در موقعیت های واقعی زندگی ، به سرعت و مقرون به صرفه ضبط کند. بدون این روش ، ساختن یک سیستم ASR عربی در این مقیاس سالها و میلیون ها تلاش دستی طول می کشد.

Munsit از مدل های OpenAI ، Microsoft و Meta در معیارهای مختلف بهتر عمل کرد. این دستاورد در مورد آینده نوآوری عربی هوش مصنوعی چه می گوید؟

آینده عربی عربی در دست ماست. و این دقیقاً همان چیزی است که این دستاورد اثبات می کند. ما دیگر نمی توانیم به فناوری هایی که در اختیار ما نیستیم یا به اشخاص ثالثی که منطقه ما را در اولویت قرار نمی دهند ، اعتماد کنیم.

Munsit نشان می دهد که ما می توانیم AI در سطح جهانی ، از منطقه را برای منطقه بسازیم-با استفاده از استعدادهای محلی برای حل مشکلات محلی. این یک سیگنال واضح است که موج بعدی نوآوری AI عربی از درون به وجود خواهد آمد.

چگونه می بینید که Munsit در نسخه های آینده در حال تحول است ، و مرزهای بعدی برای صدای عربی AI در CNTXT چیست؟

فقط باید صبر کنید و ببینید. آنچه من می توانم بگویم این است که ما یک مجموعه جدید و جدید از راه حل های عربی عربی در راه داریم-همه توسط Munsit و سایر مدلهایی که در حال حاضر در CNTXT AI می سازیم. این فقط آغاز است.

شما اغلب در مورد اهمیت “AI Sovereign” صحبت می کنید. این اصطلاح برای شما چه معنایی دارد و چرا برای خلیج فارس و منطقه گسترده تر MENA بسیار مهم است؟

از نظر من ، AI Sovereign به معنای داشتن مالکیت کامل و کنترل بر داده ها ، زیرساخت ها و مدل هایی است که آینده ما را شکل می دهد. این بسیار مهم است زیرا ما باید سرنوشت خودمان را در اختیار داشته باشیم و این با داده ها شروع می شود.

حاکمیت داده ها همه چیز است. داده ها گرانبها هستند و ما باید اطمینان حاصل کنیم که در دستان ما باقی می ماند.

ما نمی توانیم آینده خود را تحویل دهیم و بیکار بنشینیم در حالی که دیگران این فناوری را برای ما می سازند. آینده هوش مصنوعی در این منطقه از این منطقه به وجود خواهد آمد. این دقیقاً همان چیزی است که ما به سمت آن کار می کنیم.

چگونه می بینید که CNTXT AI در پنج سال آینده اکوسیستم AI را در خاورمیانه شکل می دهد؟

با فعال کردن آمادگی واقعی هوش مصنوعی. ما وارد می شویم ، می فهمیم که شرکت ها و دولت ها به چه چیزی نیاز دارند ، داده ها و استراتژی های هوش مصنوعی را می سازند و سپس به آنها در ساخت ، آزمایش ، استقرار و مقیاس کمک می کنیم.

اگر داده ها روغن جدید هستند ، داده های بدون ساختار روغن تصفیه نشده است – پر از پتانسیل اما بی فایده تا زمان پردازش. به همین دلیل ما CNTXT AI را برای کمک به سازمانها در تمیز کردن ، ساختار و فعال کردن داده های آنها ساخته ایم. زیرا اینجاست که تحول واقعی هوش مصنوعی آغاز می شود.

از نقطه نظر خود به عنوان یک کارآفرین و سرمایه گذار ، چه توصیه ای به بنیانگذاران دیگر می کنید که در بازارهای نوظهور راه اندازی هوش مصنوعی ایجاد می کنند؟

اکنون شروع کنید. سریع حرکت کنید سریعتر شکست بخورید ، سریعتر بیاموزید و تکرار کنید.

از همه مهمتر ، برای مشکلات واقعی ایجاد کنید. در نزدیکی زمین بمانید – به کاربران گوش دهید ، نه فقط اعتیاد به مواد مخدره. در بازارهای نوظهور ، ارتباط و سازگاری مهم است.

با تشکر از شما برای مصاحبه عالی ، خوانندگانی که مایل به کسب اطلاعات بیشتر هستند باید بازدید کنند cntxt aiبشر



منبع:unite.ai

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *