محققان از آزمایشگاه های اینتلبا همکاری کارشناسان دانشگاهی و صنعتی، تکنیکی پیشگامانه برای ایجاد حرکت واقعی و قابل هدایت انسانی از ورودی های پراکنده و چندوجهی معرفی کرده است. کار آنها، برجسته شده در کنفرانس اروپایی بینایی کامپیوتر (ECCV 2024)، بر غلبه بر چالش های ایجاد رفتارهای طبیعی و فیزیکی انسانی در شخصیت های انسان نما با ابعاد بالا تمرکز دارد. این تحقیق بخشی از ابتکار عمل گستردهتر آزمایشگاههای اینتل برای پیشبرد بینایی کامپیوتر و یادگیری ماشین است.
آزمایشگاه های اینتل و شرکای آن اخیرا ارائه کردند شش مقاله پیشرفته در ECCV 2024، یک کنفرانس برتر سازماندهی شده توسط انجمن بینایی کامپیوتر اروپا (ECVA).
کاغذ ایجاد حرکات فیزیکی واقعی و قابل هدایت انسان از ورودی های چند وجهی نوآوری هایی از جمله یک استراتژی دفاعی جدید برای محافظت از مدل های متن به تصویر در برابر حملات گروهی قرمز مبتنی بر فوری و توسعه یک مجموعه داده در مقیاس بزرگ طراحی شده برای بهبود سازگاری فضایی در این مدل ها به نمایش گذاشته شد. در میان این مشارکتها، این مقاله تعهد اینتل به پیشبرد مدلسازی مولد را در عین اولویتبندی برجسته میکند. هوش مصنوعی مسئول تمرینات
ایجاد حرکات واقعی انسان با استفاده از ورودی های چند وجهی
کنترلر انسان نما نقاب دار اینتل (MHC) یک سیستم پیشرفتی است که برای ایجاد حرکت انسان مانند در محیط های فیزیک شبیه سازی شده طراحی شده است. برخلاف روشهای سنتی که به شدت به دادههای ضبط حرکت کاملاً دقیق متکی هستند، MHC برای مدیریت دادههای ورودی پراکنده، ناقص یا جزئی از منابع مختلف ساخته شده است. این منابع میتوانند شامل کنترلکنندههای واقعیت مجازی باشند که ممکن است فقط حرکات دست یا سر را ردیابی کنند. ورودی های جوی استیک که فقط دستورات ناوبری سطح بالا را می دهد. ردیابی ویدیویی، جایی که ممکن است قسمت های خاصی از بدن مسدود شود. یا حتی دستورالعمل های انتزاعی که از اعلان های متنی مشتق شده اند.
نوآوری این فناوری در توانایی آن برای تفسیر و پر کردن شکاف هایی است که در آن داده ها ناقص یا ناقص هستند. این امر از طریق آنچه اینتل می گوید به دست می آورد جمعآوری، ترکیب و تکمیل (CCC) قابلیت ها:
- جبران: این ویژگی به MHC اجازه می دهد تا در هنگام بروز اختلال، مانند زمانی که سیستم در حالت شکست خورده شروع می شود، مانند یک کاراکتر انسان نما که سقوط کرده است، حرکت خود را بازیابی و مجدداً همزمان کند. این سیستم می تواند به سرعت حرکات خود را اصلاح کند و حرکت طبیعی را بدون آموزش مجدد یا تنظیمات دستی از سر بگیرد.
- ترکیب کنید: MHC میتواند توالیهای حرکتی مختلف را با هم ترکیب کند، مانند ادغام حرکات بالاتنه از یک عمل (مثلاً تکان دادن) با حرکات پایین بدن از یک عمل دیگر (مثلاً راه رفتن). این انعطافپذیری امکان تولید رفتارهای کاملاً جدید را از دادههای حرکتی موجود فراهم میکند.
- کامل: وقتی ورودیهای پراکنده مانند دادههای حرکت جزئی بدن یا دستورالعملهای سطح بالا مبهم داده میشود، MHC میتواند به طور هوشمند قسمتهای از دست رفته حرکت را استنتاج کرده و ایجاد کند. به عنوان مثال، اگر فقط حرکات بازو مشخص شده باشد، MHC می تواند به طور مستقل حرکات پا را برای حفظ تعادل فیزیکی و واقع گرایی ایجاد کند.
نتیجه یک سیستم تولید حرکت بسیار سازگار است که می تواند حرکات صاف، واقعی و از نظر فیزیکی دقیق را حتی با دستورالعمل های ناقص یا نامشخص ایجاد کند. این امر MHC را برای برنامههای کاربردی در بازی، رباتیک، واقعیت مجازی و هر سناریویی که در آن به حرکت انسانمانند با کیفیت بالا نیاز است اما دادههای ورودی محدود است، ایدهآل میکند.
تاثیر MHC بر مدل های حرکت مولد
کنترلر انسان نمای ماسک شده (MHC) بخشی از تلاش گسترده تر آزمایشگاه های اینتل و همکارانش برای ساخت مسئولانه مدل های مولد، از جمله مدل هایی است که تبدیل متن به تصویر و نسل سه بعدی وظایف همانطور که در ECCV 2024 مورد بحث قرار گرفت، این رویکرد پیامدهای قابل توجهی برای صنایعی مانند رباتیک، واقعیت مجازی، بازی و شبیه سازی دارد، جایی که تولید حرکت واقعی انسان بسیار مهم است. با ترکیب ورودیهای چند وجهی و فعال کردن کنترلکننده برای انتقال یکپارچه بین حرکات، MHC میتواند شرایط دنیای واقعی را که ممکن است دادههای حسگر ممکن است نویز یا ناقص باشد، کنترل کند.
این کار توسط آزمایشگاه های اینتل در کنار سایر تحقیقات پیشرفته ارائه شده در ECCV 2024 است، مانند دفاع جدید آنها برای مدل های متن به تصویر و توسعه تکنیک هایی برای بهبود سازگاری فضایی در تولید تصویر. این پیشرفتها با هم، رهبری اینتل را در زمینه بینایی رایانه با تمرکز بر توسعه فناوریهای هوش مصنوعی امن، مقیاسپذیر و مسئولانه نشان میدهد.
نتیجه گیری
کنترلر ماسک شده انسان نما (MHC) که توسط آزمایشگاه های اینتل و همکاران دانشگاهی توسعه یافته است، یک گام مهم رو به جلو در زمینه تولید حرکت انسان است. MHC با حل مشکل کنترل پیچیده ایجاد حرکات واقعی از ورودی های چندوجهی، راه را برای کاربردهای جدید در VR، بازی، رباتیک و شبیه سازی هموار می کند. این تحقیق که در ECCV 2024 ارائه شد، تعهد اینتل را به پیشبرد هوش مصنوعی مسئول و مدلسازی مولد نشان میدهد و به فناوریهای ایمنتر و سازگارتر در حوزههای مختلف کمک میکند.