هوش مصنوعی راه طولانی در درک بصری و پردازش زبان پیموده است. با این حال، این توانایی ها برای ساختن سیستم هایی که می توانند با دنیای فیزیکی تعامل داشته باشند کافی نیستند. انسان با استفاده از حس لامسه اشیا را کنترل می کند یا حرکات کنترل شده ای انجام می دهد. ما بافت، دما و وزن را حس می کنیم تا هر عمل را با دقت هدایت کنیم. این بازخورد لمسی به ما این امکان را می دهد که موارد شکننده را دستکاری کنیم، از ابزارها با کنترل استفاده کنیم و کارهای پیچیده را به آرامی انجام دهیم.
متا که به دلیل کارش در واقعیت مجازی و واقعیت افزوده شناخته شده است، اکنون چالش ایجاد هوش مصنوعی را بر عهده گرفته است که می تواند مانند یک انسان با دنیای فیزیکی تعامل داشته باشد. متا از طریق ابتکار FAIR Robotics خود در حال توسعه ابزارها و چارچوب های متن باز است تا حس لامسه و چابکی فیزیکی روبات ها را تقویت کند. این تلاشها میتواند به توسعه هوش مصنوعی تجسمیافته منجر شود – سیستمهایی که نه تنها میبینند، بلکه میتوانند مانند انسانها اشیا را احساس و دستکاری کنند.
Embodied AI چیست؟
تجسم هوش مصنوعی تعامل فیزیکی را با هوش مصنوعی ترکیب میکند و ماشینها را قادر میسازد تا حس کنند، پاسخ دهند و به طور طبیعی با محیط اطراف خود درگیر شوند. به جای ورودیهای «دیدن» یا «شنیدن»، به سیستمهای هوش مصنوعی اجازه میدهد احساس کنید و عمل کن جهان رباتی را در نظر بگیرید که می تواند فشاری را که به یک جسم وارد می کند حس کند، گرفتن آن را تنظیم کند و با چابکی حرکت کند. هوش مصنوعی تجسمشده هوش مصنوعی را از صفحهنمایشها و بلندگوها به دنیای فیزیکی منتقل میکند و آن را قادر به دستکاری اشیا، انجام وظایف و تعامل معنادارتر با مردم میکند.
به عنوان مثال، یک ربات ساخته شده بر روی هوش مصنوعی می تواند به یک فرد مسن کمک کند تا اشیای شکننده را بدون آسیب رساندن به آنها بردارد. در مراقبت های بهداشتی، می تواند با در دست گرفتن ابزار دقیق در حین جراحی به پزشکان کمک کند. این پتانسیل بسیار فراتر از بازوهای رباتیک در آزمایشگاه ها یا بازوهای خودکار در کارخانه ها است. این در مورد ایجاد ماشین هایی است که محیط فیزیکی خود را در زمان واقعی درک کرده و به آن پاسخ می دهند.
رویکرد متا به سمت هوش مصنوعی تجسم یافته
متا روی سه حوزه کلیدی تا هوش مصنوعی تجسم یافته را به لمس انسان مانند نزدیک کند. ابتدا، این شرکت در حال توسعه فناوریهای حسگر لمسی پیشرفته است که ماشینها را قادر میسازد مواردی مانند فشار، بافت و دما را تشخیص دهند. دوم، متا در حال ایجاد مدلهای ادراک لمسی است که به هوش مصنوعی اجازه میدهد این سیگنالها را بفهمد و به آن واکنش نشان دهد. در نهایت، متا در حال ساخت یک پلت فرم توسعه لمسی است که چندین حسگر را با این مدلهای ادراک ادغام میکند و یک سیستم کامل برای ساخت هوش مصنوعی با قابلیت لمسی ارائه میدهد. در اینجا نحوه پیشرفت متا در هوش مصنوعی در هر یک از این حوزه ها آمده است.
Meta Digit 360: Human-Level Tactile Sensing
متا معرفی کرده است رقم 360 نوک انگشت، یک فناوری حسگر لمسی است که برای ایجاد حس لامسه شبیه به هوش مصنوعی طراحی شده است. با بیش از 18 ویژگی حسگر، می تواند لرزش، گرما و حتی مواد شیمیایی را روی سطوح تشخیص دهد. مجهز به تراشه هوش مصنوعی، نوک انگشت داده های لمسی را فورا پردازش می کند و به ورودی هایی مانند گرمای اجاق گاز یا ضربه تیز سوزن پاسخ می دهد. این فناوری بهعنوان یک «سیستم عصبی محیطی» در هوش مصنوعی عمل میکند و واکنشهای بازتابی مشابه واکنشهای انسانی را شبیهسازی میکند. متا این نوک انگشت را با یک سیستم نوری منحصر به فرد حاوی بیش از 8 میلیون تکسل توسعه داده است که می تواند لمس را از هر زاویه ای ثبت کند. جزئیات ریز را حس میکند، تا نیروهایی به کوچکی یک میلینیوتن، که به هوش مصنوعی تجسمشده حساسیت دقیقی نسبت به محیط خود میدهد.
متا اسپارش: بنیاد ادراک لمسی
متا قابلیتهای درک لمس را تقویت میکند تا به هوش مصنوعی کمک کند تا احساسات فیزیکی را درک کند و به آنها پاسخ دهد. نام آن از کلمه سانسکریت برای “لمس” گرفته شده است. اسپارش به عنوان “مغز لمسی” برای هوش مصنوعی تجسم یافته عمل می کند. این مدل به ماشینها اجازه میدهد سیگنالهای لمسی پیچیده مانند فشار و گرفتن را تفسیر کنند.
یکی از ویژگی های برجسته اسپارش تطبیق پذیری آن است. سیستمهای لمسی سنتی مدلهای جداگانهای را برای هر کار به کار میگیرند که به شدت بر دادههای برچسبگذاری شده و حسگرهای خاص تکیه دارند. Sparsh این رویکرد را به کلی تغییر می دهد. به عنوان یک مدل همه منظوره، با سنسورها و وظایف مختلف سازگار است. با استفاده از الگوهای لمسی یاد می گیرد یادگیری خود نظارتی (SSL) در یک پایگاه داده عظیم از بیش از 460000 تصویر لمسی – بدون نیاز به داده های برچسب دار.
متا همچنین TacBench را معرفی کرده است، یک بنچمارک جدید با شش وظیفه لمسی برای ارزیابی توانایی های اسپارش. متا ادعا می کند که اسپارش 95.1 درصد از مدل های سنتی بهتر عمل کرده است، به خصوص در سناریوهای کم داده. نسخههای Sparsh که بر اساس معماریهای I-JEPA و DINO متا ساخته شدهاند، تواناییهای قابل توجهی را در کارهایی مانند تخمین نیرو، تشخیص لغزش و دستکاری پیچیده نشان دادهاند.
Meta Digit Plexus: بستری برای توسعه سیستم لمسی
متا Digit Plexus را برای ادغام فناوریهای حسگر و مدلهای ادراک لمسی برای ایجاد یک سیستم هوش مصنوعی تجسم یافته معرفی کرده است. این پلتفرم حسگرهای نوک انگشت و کف دست را در یک دست رباتیک ترکیب میکند تا پاسخهای لمسی هماهنگتری را فعال کند. این تنظیمات به هوش مصنوعی تجسمیافته اجازه میدهد تا بازخورد حسی را پردازش کند و اعمال خود را در زمان واقعی تنظیم کند، مانند نحوه حرکت و واکنش دست انسان.
با استاندارد کردن بازخورد لمسی در سراسر دست، دیجیت پلکسس دقت و کنترل هوش مصنوعی تجسم یافته را افزایش می دهد. این توسعه به ویژه در زمینه هایی مانند تولید و مراقبت های بهداشتی، که در آن رسیدگی دقیق ضروری است، حیاتی است. این پلتفرم حسگرهایی مانند نوک انگشت و ReSkin را به یک سیستم کنترل متصل میکند و جمعآوری، کنترل و تجزیه و تحلیل دادهها را از طریق یک کابل ساده میکند.
متا در حال انتشار نرم افزار و طراحی های سخت افزاری برای Digit Plexus در جامعه متن باز است. هدف، تقویت همکاری و تسریع تحقیقات در هوش مصنوعی تجسم یافته، ایجاد نوآوری و پیشرفت در این زمینه ها است.
ترویج تحقیق و توسعه هوش مصنوعی تجسم یافته
متا نه تنها فناوری بلکه منابعی را برای ترویج تحقیق و توسعه هوش مصنوعی تجسم یافته نیز پیش می برد. یک ابتکار کلیدی، توسعه معیارهایی برای ارزیابی مدلهای هوش مصنوعی است. یکی از این معیارها، PARTNR (Planning And Reasoning Tasks in HumaN-Robot collaboration)، نحوه تعامل مدلهای هوش مصنوعی با انسانها را در طول کارهای خانگی ارزیابی میکند. با استفاده از شبیه ساز Habitat 3.0، PARTNR یک محیط واقعی را فراهم می کند که در آن ربات ها در انجام کارهایی مانند تمیز کردن و پخت و پز کمک می کنند. با بیش از 100000 کار مبتنی بر زبان، هدف آن تسریع پیشرفت در هوش مصنوعی تجسم یافته است.
علاوه بر ابتکارات داخلی، متا با سازمان هایی مانند شرکت GelSight و رباتیک وونیک برای تسریع پذیرش فناوری های حسگر لمسی. GelSight حسگرهای Digit 360 را توزیع خواهد کرد، در حالی که Wonik Robotics آلگرو Hand را تولید خواهد کرد که فناوری Digit Plexus را ادغام می کند. با در دسترس قرار دادن این فناوریها از طریق پلتفرمهای منبع باز و مشارکت، متا به ایجاد اکوسیستمی کمک میکند که میتواند به نوآوریهایی در مراقبتهای بهداشتی، تولید و کمکهای داخلی منجر شود.
خط پایین
متا در حال پیشرفت هوش مصنوعی تجسم یافته است و آن را فراتر از بینایی و صدا می برد و حس لامسه را نیز شامل می شود. با نوآوری هایی مانند Digit 360 و Sparsh، سیستم های هوش مصنوعی توانایی احساس و پاسخگویی دقیق به محیط اطراف خود را به دست می آورند. متا با به اشتراک گذاری این فناوری ها با جامعه متن باز و مشارکت با سازمان های کلیدی، به تسریع توسعه حس لامسه کمک می کند. این پیشرفت میتواند به پیشرفتهایی در زمینههایی مانند مراقبتهای بهداشتی، تولید، و کمکهای خانگی منجر شود و هوش مصنوعی را در کارهای دنیای واقعی توانمندتر و پاسخگوتر کند.