Joshua Xu یکی از بنیانگذاران و مدیرعامل در هی جن پلتفرمی که کاربران را قادر میسازد تا بدون زحمت ویدیوهایی با کیفیت استودیویی با آواتارها و صداهای تولید شده توسط هوش مصنوعی تولید کنند.
شما در سال 2020 شرکت HeyGen را با چشم انداز اختراع مجدد داستان سرایی بصری از طریق هوش مصنوعی تأسیس کردید. آیا می توانید آنچه را که الهام بخش شما برای راه اندازی HeyGen و چشم انداز اولیه خود برای این ماموریت شد، به اشتراک بگذارید؟
قبل از تأسیس HeyGen، من در تیم تبلیغاتی اسنپ کار میکردم، جایی که پیشگام ادغام هوش مصنوعی در پلتفرم اسنپ چت بودم. بعداً، تیمهایی را عوض کردم تا روی دوربین تقویتشده هوش مصنوعی کار کنند. سال 2018 بود و هوش مصنوعی در آن زمان به اندازه اکنون توجه زیادی را به خود جلب نکرد، اما تیم ما سخت کار کرد تا با استفاده از هوش مصنوعی آیتم هایی را برای تصاویر و ویدیوها ایجاد کند که در آن زمان وجود نداشت. در آن زمان بود که متوجه شدم رایانه می تواند ویدیوهای با کیفیت و واقعی ایجاد کند. من در مورد پتانسیل این فناوری و اینکه چگونه می تواند به طور کامل نحوه تولید محتوا را تغییر دهد هیجان زده شدم.
پلتفرمهای محتوای جدید، معرفی دوربین موبایل را متحول کرده است. مشاهده کرده ایم که اینستاگرام، اسنپ چت، تیک تاک و دیگر پلتفرم های محتوا ظهور کرده و راه جدیدی را برای تولیدکنندگان محتوا برای ایجاد محتوای شخصی سازی شده و با کیفیت باز می کنند. اما حتی با کمک دوربین موبایل، باز هم موانعی برای تولید محتوای درجه یک وجود دارد. برخی از موانعی که من تجربه کردم عبارتند از: مهارت های روی دوربین، زمان و منابع مورد نیاز برای ضبط ویدیوها، و هزینه های بالای تولید.
در HeyGen، ما معتقدیم که دوربین قابل تعویض است. من حرفهام را در فضای دوربین موبایل رشد دادم، جایی که روی نرمافزار و فناوری کار کردم تا تولید محتوا را برای مردم آسانتر کنم. اما این مخاطبان هنوز برای ایجاد محتوای باکیفیت تنها با استفاده از دوربین های موبایل تلاش می کنند. تیم ما در HeyGen احساس میکند که اگر بتوانیم دوربین را جایگزین کنیم، به این معناست که میتوانیم مانع داستانگویی بصری و تولید محتوا را برداریم، که به ما یک گام جلوتر میدهد.
آیا می توانید در مورد چالش هایی که HeyGen در مراحل اولیه خود با آن مواجه بود و اینکه چگونه تیم برای دستیابی به سودآوری و رشد سریع بر آنها غلبه کرد، صحبت کنید؟
از آنجایی که مصرف کنندگان هنوز در صنعت هوش مصنوعی مولد جدید هستند، سوالات زیادی در مورد خط مشی اخلاقی HeyGen دارند. ما می خواهیم تکرار کنیم که سیاست ها و محصولات HeyGen به شدت ایجاد محتوای غیرمجاز را ممنوع می کند و ما سوء استفاده از پلتفرم خود را بسیار جدی می گیریم.
تدابیر امنیتی ما شامل تأیید پیشرفته کاربر، از جمله رضایت ویدیویی زنده، رمزهای عبور شفاهی پویا، و بررسی سریع انسانی همه تأییدیههای آواتار است. تا جایی که می دانیم، از زمان اجرای این پروتکل ها هیچ سوء استفاده ای رخ نداده است. اعتماد و ایمنی برای کسب و کار ما حیاتی است و ما به طور فعال در سراسر صنعت شریک هستیم تا به توسعه ابزارها و بهترین شیوه های لازم برای مبارزه با اطلاعات نادرست و سوء استفاده از هوش مصنوعی ادامه دهیم.
چگونه فناوری هوش مصنوعی HeyGen به کسبوکارها امکان میدهد 10 برابر سریعتر و با هزینههای اضافی کمتری ویدیو ایجاد کنند؟
وقتی HeyGen را راه اندازی کردم، فهمیدم که ویرایش ویدیوها هزینه بر نیست، اما استخدام یک تیم تولید ویدیو هزینه بر است. از آنجایی که ما در دنیای اول ویدیو زندگی می کنیم، کسب و کارها می خواهند با استفاده از محتوای ویدیویی مخاطبان خود را جذب کنند، اما به دلیل هزینه و پیچیدگی تولید ویدیو از آنها جلوگیری می شود. HeyGen به شرکتها کمک میکند تا ویدیوهای حرفهای تولید کنند، همراه با آواتارهای هوش مصنوعی متن به گفتار که آن ویدیوها را از ابتدا روایت میکنند. با تولید ویدیوی HeyGen، برای ایجاد ویدیو برای کسب و کار خود به استودیو، بازیگران یا مهارت های تخصصی نیاز ندارید.
وقتی کسبوکارها گروههای فیلم را استخدام میکنند – خرید تجهیزات گرانقیمت، برخورد با بازیگران سختگیر، مالیات بر فیلمبرداری مجدد، و ویرایش آزاردهنده پس از تولید – کاربران HeyGen ۱۰ برابر سریعتر ویدیو میسازند. این باعث صرفه جویی در زمان و هزینه تیم ها می شود و افزایش مقیاس محتوایی که بر نتایج نهایی آنها تأثیر می گذارد آسان تر می کند.
توانایی بومی سازی ویدیوها به بیش از 175 زبان و گویش قابل توجه است. آیا می توانید توضیح دهید که چگونه HeyGen به این امر دست می یابد و همگام سازی طبیعی لب و کیفیت صدا را حفظ می کند؟
تیم ما در HeyGen از فناوری تبدیل متن به گفتار استفاده می کند. این بدان معنی است که HeyGen متنی را که می نویسید به فایل های صوتی تبدیل می کند. ما روی ایجاد کیفیت ویدیوی تولید ویدیو بالاتر از آستانه خود تمرکز کردیم و میخواهیم به مردم کمک کنیم دوربین واقعی را جایگزین کنند و روند تولید محتوا را افزایش دهند.
با بیش از 40000 مشتری پرداختی، بیشترین پذیرش را از کدام صنایع یا انواع کسب و کارها می بینید؟
HeyGen به بیش از 40000 مشتری ما کمک میکند سه کار را انجام دهند: ایجاد، بومیسازی و شخصیسازی ویدیوها بدون هزینههای اضافی که شامل استخدام یک شرکت تولیدی است. نرم افزار ما در بین تیم های بازاریابی محبوبیت پیدا می کند، جایی که مطمئناً شاهد افزایش بومی سازی هستیم.
مک دونالد و The Weather Channel از مشتریان قابل توجه شما هستند. آیا میتوانید جزئیات بیشتری درباره این همکاریها و نتایجی که با استفاده از HeyGen به دست آوردند، به اشتراک بگذارید؟
کمپین “اتصالات شیرین” مک دونالد برای تیم ما هیجان انگیز بود. این فناوری HeyGen، به ویژه ویژگی ترجمه ما را برجسته کرد. نوهها پیامی را به زبان مادربزرگ خود با فناوری Translate ما ضبط کردند. این به دنیا نشان داد که هوش مصنوعی برای همه از جمله مادربزرگ ها و نوه هایشان است.
ما همچنین با برنامه توسعه سازمان ملل متحد (UNDP) در یک پروژه جهانی برای کمپین جدید Weather Kids که با مشارکت سازمان جهانی هواشناسی (WMO) و The Weather Channel ایجاد شد، همکاری کردیم. این کمپین بخشی از تلاش های UNDP برای افزایش آگاهی از تأثیرات تغییرات آب و هوا و بسیج مردم در سراسر جهان برای انجام اقدامات آب و هوایی معنادار برای نسل های آینده بود. بینندگان میتوانند پیشبینی سال 2050 ارائهشده توسط Weather Kids را تماشا کنند: یک پیشبینی ویژه از سال 2050 که توسط هواشناسان بچه با پشتیبانی HeyGen ارائه شده است.
زمینه تولید ویدئو با هوش مصنوعی به سرعت در حال پیشرفت است. چه برنامهها یا پیشرفتهایی در آینده در فناوری ویدیوی هوش مصنوعی پیشبینی میکنید، و HeyGen چگونه خود را در این زمینه قرار میدهد؟
اگر مردم بتوانند محتوای ویدیویی جذابی تولید کنند، طبیعتاً ویدیوهای بیشتری ایجاد خواهند کرد و هدف هر کسب و کاری افزایش خروجی ویدیوی خود در دنیای اول ویدیوی امروزی است. برای HeyGen، ما خودمان را می بینیم که با استفاده از یک آواتار تمام بدن، ویدیوهای شخصی سازی شده برای همه مشتریانمان ایجاد می کنیم.
نقش هوش مصنوعی را در زمینه گستردهتر داستانسرایی دیجیتال و ایجاد محتوا در طول پنج سال آینده چگونه متصور میشوید؟
احتمالات زیادی وجود دارد. مردم اکنون می توانند فیلم را جمع آوری کنند و از ویرایش مبتنی بر هوش مصنوعی برای ایجاد یک ویدیو صیقلی استفاده کنند. اگر با هوش مصنوعی مولد به مسیر رو به جلو ادامه دهیم، میتوانیم فناوری را پیش ببریم و عملکرد را به میزان قابل توجهی افزایش دهیم. این در نهایت می تواند منجر به تجربه نتایج حاصل از ایجاد هوش مصنوعی در فضای پخش شود.
چگونه تولید ویدیوی هوش مصنوعی در نهایت صنعت فیلم را مختل می کند؟
در حالی که HeyGen در طراحی ویدئوهای سفارشی برای مشاغل تخصص دارد، ما معتقدیم که می توان محتوای جذاب و با کیفیت بالا را حتی بدون دوربین موبایل ایجاد کرد.
وقتی صحبت از هنرهای خلاقانه می شود، هوش مصنوعی قطعا صنعت فیلم را مختل خواهد کرد. در حالی که این تمرکز HeyGen نیست، جهانی را تصور کنید که در آن مردم یک ویدیو را بومی سازی می کنند. این رویکرد میتواند شامل استفاده از هوش مصنوعی مولد بهجای تحمیل هزینههای اضافی برای عکسبرداری مجدد باشد.
HeyGen اخیرا با موفقیت سرمایه 60 میلیون دلاری سری A را جمع آوری کرد، این چه تاثیری بر برنامه های آتی شرکت خواهد داشت؟
از آنجایی که کسبوکار ما از سه ماهه دوم سال 2023 سودآور بوده است، دور سرمایهگذاری سری A ما عمدتاً بر جذب مشاوران و سرمایهگذاران کلاس جهانی متمرکز بود تا به ما در مقیاسبندی کمک کنند. همچنین به ما کمک می کند تا نقشه راه محصول خود را تسریع کنیم و رشد تیم های بازار مستقر در لس آنجلس، سانفرانسیسکو، پالو آلتو و تورنتو را گسترش دهیم.
با تشکر از شما برای مصاحبه عالی، خوانندگانی که مایل به کسب اطلاعات بیشتر هستند باید از آن بازدید کنند هی جن.