Joshua Xu، یکی از بنیانگذاران و مدیر عامل در HeyGen – سری مصاحبه


Joshua Xu یکی از بنیانگذاران و مدیرعامل در هی جن پلتفرمی که کاربران را قادر می‌سازد تا بدون زحمت ویدیوهایی با کیفیت استودیویی با آواتارها و صداهای تولید شده توسط هوش مصنوعی تولید کنند.

شما در سال 2020 شرکت HeyGen را با چشم انداز اختراع مجدد داستان سرایی بصری از طریق هوش مصنوعی تأسیس کردید. آیا می توانید آنچه را که الهام بخش شما برای راه اندازی HeyGen و چشم انداز اولیه خود برای این ماموریت شد، به اشتراک بگذارید؟

قبل از تأسیس HeyGen، من در تیم تبلیغاتی اسنپ کار می‌کردم، جایی که پیشگام ادغام هوش مصنوعی در پلتفرم اسنپ چت بودم. بعداً، تیم‌هایی را عوض کردم تا روی دوربین تقویت‌شده هوش مصنوعی کار کنند. سال 2018 بود و هوش مصنوعی در آن زمان به اندازه اکنون توجه زیادی را به خود جلب نکرد، اما تیم ما سخت کار کرد تا با استفاده از هوش مصنوعی آیتم هایی را برای تصاویر و ویدیوها ایجاد کند که در آن زمان وجود نداشت. در آن زمان بود که متوجه شدم رایانه می تواند ویدیوهای با کیفیت و واقعی ایجاد کند. من در مورد پتانسیل این فناوری و اینکه چگونه می تواند به طور کامل نحوه تولید محتوا را تغییر دهد هیجان زده شدم.

پلتفرم‌های محتوای جدید، معرفی دوربین موبایل را متحول کرده است. مشاهده کرده ایم که اینستاگرام، اسنپ چت، تیک تاک و دیگر پلتفرم های محتوا ظهور کرده و راه جدیدی را برای تولیدکنندگان محتوا برای ایجاد محتوای شخصی سازی شده و با کیفیت باز می کنند. اما حتی با کمک دوربین موبایل، باز هم موانعی برای تولید محتوای درجه یک وجود دارد. برخی از موانعی که من تجربه کردم عبارتند از: مهارت های روی دوربین، زمان و منابع مورد نیاز برای ضبط ویدیوها، و هزینه های بالای تولید.

در HeyGen، ما معتقدیم که دوربین قابل تعویض است. من حرفه‌ام را در فضای دوربین موبایل رشد دادم، جایی که روی نرم‌افزار و فناوری کار کردم تا تولید محتوا را برای مردم آسان‌تر کنم. اما این مخاطبان هنوز برای ایجاد محتوای باکیفیت تنها با استفاده از دوربین های موبایل تلاش می کنند. تیم ما در HeyGen احساس می‌کند که اگر بتوانیم دوربین را جایگزین کنیم، به این معناست که می‌توانیم مانع داستان‌گویی بصری و تولید محتوا را برداریم، که به ما یک گام جلوتر می‌دهد.

آیا می توانید در مورد چالش هایی که HeyGen در مراحل اولیه خود با آن مواجه بود و اینکه چگونه تیم برای دستیابی به سودآوری و رشد سریع بر آنها غلبه کرد، صحبت کنید؟

از آنجایی که مصرف کنندگان هنوز در صنعت هوش مصنوعی مولد جدید هستند، سوالات زیادی در مورد خط مشی اخلاقی HeyGen دارند. ما می خواهیم تکرار کنیم که سیاست ها و محصولات HeyGen به شدت ایجاد محتوای غیرمجاز را ممنوع می کند و ما سوء استفاده از پلتفرم خود را بسیار جدی می گیریم.

تدابیر امنیتی ما شامل تأیید پیشرفته کاربر، از جمله رضایت ویدیویی زنده، رمزهای عبور شفاهی پویا، و بررسی سریع انسانی همه تأییدیه‌های آواتار است. تا جایی که می دانیم، از زمان اجرای این پروتکل ها هیچ سوء استفاده ای رخ نداده است. اعتماد و ایمنی برای کسب و کار ما حیاتی است و ما به طور فعال در سراسر صنعت شریک هستیم تا به توسعه ابزارها و بهترین شیوه های لازم برای مبارزه با اطلاعات نادرست و سوء استفاده از هوش مصنوعی ادامه دهیم.

چگونه فناوری هوش مصنوعی HeyGen به کسب‌وکارها امکان می‌دهد 10 برابر سریع‌تر و با هزینه‌های اضافی کمتری ویدیو ایجاد کنند؟

وقتی HeyGen را راه اندازی کردم، فهمیدم که ویرایش ویدیوها هزینه بر نیست، اما استخدام یک تیم تولید ویدیو هزینه بر است. از آنجایی که ما در دنیای اول ویدیو زندگی می کنیم، کسب و کارها می خواهند با استفاده از محتوای ویدیویی مخاطبان خود را جذب کنند، اما به دلیل هزینه و پیچیدگی تولید ویدیو از آنها جلوگیری می شود. HeyGen به شرکت‌ها کمک می‌کند تا ویدیوهای حرفه‌ای تولید کنند، همراه با آواتارهای هوش مصنوعی متن به گفتار که آن ویدیوها را از ابتدا روایت می‌کنند. با تولید ویدیوی HeyGen، برای ایجاد ویدیو برای کسب و کار خود به استودیو، بازیگران یا مهارت های تخصصی نیاز ندارید.

وقتی کسب‌وکارها گروه‌های فیلم را استخدام می‌کنند – خرید تجهیزات گران‌قیمت، برخورد با بازیگران سخت‌گیر، مالیات بر فیلم‌برداری مجدد، و ویرایش آزاردهنده پس از تولید – کاربران HeyGen ۱۰ برابر سریع‌تر ویدیو می‌سازند. این باعث صرفه جویی در زمان و هزینه تیم ها می شود و افزایش مقیاس محتوایی که بر نتایج نهایی آنها تأثیر می گذارد آسان تر می کند.

توانایی بومی سازی ویدیوها به بیش از 175 زبان و گویش قابل توجه است. آیا می توانید توضیح دهید که چگونه HeyGen به این امر دست می یابد و همگام سازی طبیعی لب و کیفیت صدا را حفظ می کند؟

تیم ما در HeyGen از فناوری تبدیل متن به گفتار استفاده می کند. این بدان معنی است که HeyGen متنی را که می نویسید به فایل های صوتی تبدیل می کند. ما روی ایجاد کیفیت ویدیوی تولید ویدیو بالاتر از آستانه خود تمرکز کردیم و می‌خواهیم به مردم کمک کنیم دوربین واقعی را جایگزین کنند و روند تولید محتوا را افزایش دهند.

با بیش از 40000 مشتری پرداختی، بیشترین پذیرش را از کدام صنایع یا انواع کسب و کارها می بینید؟

HeyGen به بیش از 40000 مشتری ما کمک می‌کند سه کار را انجام دهند: ایجاد، بومی‌سازی و شخصی‌سازی ویدیوها بدون هزینه‌های اضافی که شامل استخدام یک شرکت تولیدی است. نرم افزار ما در بین تیم های بازاریابی محبوبیت پیدا می کند، جایی که مطمئناً شاهد افزایش بومی سازی هستیم.

مک دونالد و The Weather Channel از مشتریان قابل توجه شما هستند. آیا می‌توانید جزئیات بیشتری درباره این همکاری‌ها و نتایجی که با استفاده از HeyGen به دست آوردند، به اشتراک بگذارید؟

کمپین “اتصالات شیرین” مک دونالد برای تیم ما هیجان انگیز بود. این فناوری HeyGen، به ویژه ویژگی ترجمه ما را برجسته کرد. نوه‌ها پیامی را به زبان مادربزرگ خود با فناوری Translate ما ضبط کردند. این به دنیا نشان داد که هوش مصنوعی برای همه از جمله مادربزرگ ها و نوه هایشان است.

ما همچنین با برنامه توسعه سازمان ملل متحد (UNDP) در یک پروژه جهانی برای کمپین جدید Weather Kids که با مشارکت سازمان جهانی هواشناسی (WMO) و The Weather Channel ایجاد شد، همکاری کردیم. این کمپین بخشی از تلاش های UNDP برای افزایش آگاهی از تأثیرات تغییرات آب و هوا و بسیج مردم در سراسر جهان برای انجام اقدامات آب و هوایی معنادار برای نسل های آینده بود. بینندگان می‌توانند پیش‌بینی سال 2050 ارائه‌شده توسط Weather Kids را تماشا کنند: یک پیش‌بینی ویژه از سال 2050 که توسط هواشناسان بچه با پشتیبانی HeyGen ارائه شده است.

زمینه تولید ویدئو با هوش مصنوعی به سرعت در حال پیشرفت است. چه برنامه‌ها یا پیشرفت‌هایی در آینده در فناوری ویدیوی هوش مصنوعی پیش‌بینی می‌کنید، و HeyGen چگونه خود را در این زمینه قرار می‌دهد؟

اگر مردم بتوانند محتوای ویدیویی جذابی تولید کنند، طبیعتاً ویدیوهای بیشتری ایجاد خواهند کرد و هدف هر کسب و کاری افزایش خروجی ویدیوی خود در دنیای اول ویدیوی امروزی است. برای HeyGen، ما خودمان را می بینیم که با استفاده از یک آواتار تمام بدن، ویدیوهای شخصی سازی شده برای همه مشتریانمان ایجاد می کنیم.

نقش هوش مصنوعی را در زمینه گسترده‌تر داستان‌سرایی دیجیتال و ایجاد محتوا در طول پنج سال آینده چگونه متصور می‌شوید؟

احتمالات زیادی وجود دارد. مردم اکنون می توانند فیلم را جمع آوری کنند و از ویرایش مبتنی بر هوش مصنوعی برای ایجاد یک ویدیو صیقلی استفاده کنند. اگر با هوش مصنوعی مولد به مسیر رو به جلو ادامه دهیم، می‌توانیم فناوری را پیش ببریم و عملکرد را به میزان قابل توجهی افزایش دهیم. این در نهایت می تواند منجر به تجربه نتایج حاصل از ایجاد هوش مصنوعی در فضای پخش شود.

چگونه تولید ویدیوی هوش مصنوعی در نهایت صنعت فیلم را مختل می کند؟

در حالی که HeyGen در طراحی ویدئوهای سفارشی برای مشاغل تخصص دارد، ما معتقدیم که می توان محتوای جذاب و با کیفیت بالا را حتی بدون دوربین موبایل ایجاد کرد.

وقتی صحبت از هنرهای خلاقانه می شود، هوش مصنوعی قطعا صنعت فیلم را مختل خواهد کرد. در حالی که این تمرکز HeyGen نیست، جهانی را تصور کنید که در آن مردم یک ویدیو را بومی سازی می کنند. این رویکرد می‌تواند شامل استفاده از هوش مصنوعی مولد به‌جای تحمیل هزینه‌های اضافی برای عکس‌برداری مجدد باشد.

HeyGen اخیرا با موفقیت سرمایه 60 میلیون دلاری سری A را جمع آوری کرد، این چه تاثیری بر برنامه های آتی شرکت خواهد داشت؟

از آنجایی که کسب‌وکار ما از سه ماهه دوم سال 2023 سودآور بوده است، دور سرمایه‌گذاری سری A ما عمدتاً بر جذب مشاوران و سرمایه‌گذاران کلاس جهانی متمرکز بود تا به ما در مقیاس‌بندی کمک کنند. همچنین به ما کمک می کند تا نقشه راه محصول خود را تسریع کنیم و رشد تیم های بازار مستقر در لس آنجلس، سانفرانسیسکو، پالو آلتو و تورنتو را گسترش دهیم.

با تشکر از شما برای مصاحبه عالی، خوانندگانی که مایل به کسب اطلاعات بیشتر هستند باید از آن بازدید کنند هی جن.



منبع:unite.ai

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *