پیشرفت هوش مصنوعی تجسم یافته: چگونه متا لمس و مهارت انسان را به هوش مصنوعی می آورد


هوش مصنوعی راه طولانی در درک بصری و پردازش زبان پیموده است. با این حال، این توانایی ها برای ساختن سیستم هایی که می توانند با دنیای فیزیکی تعامل داشته باشند کافی نیستند. انسان با استفاده از حس لامسه اشیا را کنترل می کند یا حرکات کنترل شده ای انجام می دهد. ما بافت، دما و وزن را حس می کنیم تا هر عمل را با دقت هدایت کنیم. این بازخورد لمسی به ما این امکان را می دهد که موارد شکننده را دستکاری کنیم، از ابزارها با کنترل استفاده کنیم و کارهای پیچیده را به آرامی انجام دهیم.

متا که به دلیل کارش در واقعیت مجازی و واقعیت افزوده شناخته شده است، اکنون چالش ایجاد هوش مصنوعی را بر عهده گرفته است که می تواند مانند یک انسان با دنیای فیزیکی تعامل داشته باشد. متا از طریق ابتکار FAIR Robotics خود در حال توسعه ابزارها و چارچوب های متن باز است تا حس لامسه و چابکی فیزیکی روبات ها را تقویت کند. این تلاش‌ها می‌تواند به توسعه هوش مصنوعی تجسم‌یافته منجر شود – سیستم‌هایی که نه تنها می‌بینند، بلکه می‌توانند مانند انسان‌ها اشیا را احساس و دستکاری کنند.

Embodied AI چیست؟

تجسم هوش مصنوعی تعامل فیزیکی را با هوش مصنوعی ترکیب می‌کند و ماشین‌ها را قادر می‌سازد تا حس کنند، پاسخ دهند و به طور طبیعی با محیط اطراف خود درگیر شوند. به جای ورودی‌های «دیدن» یا «شنیدن»، به سیستم‌های هوش مصنوعی اجازه می‌دهد احساس کنید و عمل کن جهان رباتی را در نظر بگیرید که می تواند فشاری را که به یک جسم وارد می کند حس کند، گرفتن آن را تنظیم کند و با چابکی حرکت کند. هوش مصنوعی تجسم‌شده هوش مصنوعی را از صفحه‌نمایش‌ها و بلندگوها به دنیای فیزیکی منتقل می‌کند و آن را قادر به دستکاری اشیا، انجام وظایف و تعامل معنادارتر با مردم می‌کند.

به عنوان مثال، یک ربات ساخته شده بر روی هوش مصنوعی می تواند به یک فرد مسن کمک کند تا اشیای شکننده را بدون آسیب رساندن به آنها بردارد. در مراقبت های بهداشتی، می تواند با در دست گرفتن ابزار دقیق در حین جراحی به پزشکان کمک کند. این پتانسیل بسیار فراتر از بازوهای رباتیک در آزمایشگاه ها یا بازوهای خودکار در کارخانه ها است. این در مورد ایجاد ماشین هایی است که محیط فیزیکی خود را در زمان واقعی درک کرده و به آن پاسخ می دهند.

رویکرد متا به سمت هوش مصنوعی تجسم یافته

متا روی سه حوزه کلیدی تا هوش مصنوعی تجسم یافته را به لمس انسان مانند نزدیک کند. ابتدا، این شرکت در حال توسعه فناوری‌های حسگر لمسی پیشرفته است که ماشین‌ها را قادر می‌سازد مواردی مانند فشار، بافت و دما را تشخیص دهند. دوم، متا در حال ایجاد مدل‌های ادراک لمسی است که به هوش مصنوعی اجازه می‌دهد این سیگنال‌ها را بفهمد و به آن واکنش نشان دهد. در نهایت، متا در حال ساخت یک پلت فرم توسعه لمسی است که چندین حسگر را با این مدل‌های ادراک ادغام می‌کند و یک سیستم کامل برای ساخت هوش مصنوعی با قابلیت لمسی ارائه می‌دهد. در اینجا نحوه پیشرفت متا در هوش مصنوعی در هر یک از این حوزه ها آمده است.

Meta Digit 360: Human-Level Tactile Sensing

متا معرفی کرده است رقم 360 نوک انگشت، یک فناوری حسگر لمسی است که برای ایجاد حس لامسه شبیه به هوش مصنوعی طراحی شده است. با بیش از 18 ویژگی حسگر، می تواند لرزش، گرما و حتی مواد شیمیایی را روی سطوح تشخیص دهد. مجهز به تراشه هوش مصنوعی، نوک انگشت داده های لمسی را فورا پردازش می کند و به ورودی هایی مانند گرمای اجاق گاز یا ضربه تیز سوزن پاسخ می دهد. این فناوری به‌عنوان یک «سیستم عصبی محیطی» در هوش مصنوعی عمل می‌کند و واکنش‌های بازتابی مشابه واکنش‌های انسانی را شبیه‌سازی می‌کند. متا این نوک انگشت را با یک سیستم نوری منحصر به فرد حاوی بیش از 8 میلیون تکسل توسعه داده است که می تواند لمس را از هر زاویه ای ثبت کند. جزئیات ریز را حس می‌کند، تا نیروهایی به کوچکی یک میلی‌نیوتن، که به هوش مصنوعی تجسم‌شده حساسیت دقیقی نسبت به محیط خود می‌دهد.

متا اسپارش: بنیاد ادراک لمسی

متا قابلیت‌های درک لمس را تقویت می‌کند تا به هوش مصنوعی کمک کند تا احساسات فیزیکی را درک کند و به آنها پاسخ دهد. نام آن از کلمه سانسکریت برای “لمس” گرفته شده است. اسپارش به عنوان “مغز لمسی” برای هوش مصنوعی تجسم یافته عمل می کند. این مدل به ماشین‌ها اجازه می‌دهد سیگنال‌های لمسی پیچیده مانند فشار و گرفتن را تفسیر کنند.

یکی از ویژگی های برجسته اسپارش تطبیق پذیری آن است. سیستم‌های لمسی سنتی مدل‌های جداگانه‌ای را برای هر کار به کار می‌گیرند که به شدت بر داده‌های برچسب‌گذاری شده و حسگرهای خاص تکیه دارند. Sparsh این رویکرد را به کلی تغییر می دهد. به عنوان یک مدل همه منظوره، با سنسورها و وظایف مختلف سازگار است. با استفاده از الگوهای لمسی یاد می گیرد یادگیری خود نظارتی (SSL) در یک پایگاه داده عظیم از بیش از 460000 تصویر لمسی – بدون نیاز به داده های برچسب دار.

متا همچنین TacBench را معرفی کرده است، یک بنچمارک جدید با شش وظیفه لمسی برای ارزیابی توانایی های اسپارش. متا ادعا می کند که اسپارش 95.1 درصد از مدل های سنتی بهتر عمل کرده است، به خصوص در سناریوهای کم داده. نسخه‌های Sparsh که بر اساس معماری‌های I-JEPA و DINO متا ساخته شده‌اند، توانایی‌های قابل توجهی را در کارهایی مانند تخمین نیرو، تشخیص لغزش و دستکاری پیچیده نشان داده‌اند.

Meta Digit Plexus: بستری برای توسعه سیستم لمسی

متا Digit Plexus را برای ادغام فناوری‌های حسگر و مدل‌های ادراک لمسی برای ایجاد یک سیستم هوش مصنوعی تجسم یافته معرفی کرده است. این پلتفرم حسگرهای نوک انگشت و کف دست را در یک دست رباتیک ترکیب می‌کند تا پاسخ‌های لمسی هماهنگ‌تری را فعال کند. این تنظیمات به هوش مصنوعی تجسم‌یافته اجازه می‌دهد تا بازخورد حسی را پردازش کند و اعمال خود را در زمان واقعی تنظیم کند، مانند نحوه حرکت و واکنش دست انسان.

با استاندارد کردن بازخورد لمسی در سراسر دست، دیجیت پلکسس دقت و کنترل هوش مصنوعی تجسم یافته را افزایش می دهد. این توسعه به ویژه در زمینه هایی مانند تولید و مراقبت های بهداشتی، که در آن رسیدگی دقیق ضروری است، حیاتی است. این پلتفرم حسگرهایی مانند نوک انگشت و ReSkin را به یک سیستم کنترل متصل می‌کند و جمع‌آوری، کنترل و تجزیه و تحلیل داده‌ها را از طریق یک کابل ساده می‌کند.

متا در حال انتشار نرم افزار و طراحی های سخت افزاری برای Digit Plexus در جامعه متن باز است. هدف، تقویت همکاری و تسریع تحقیقات در هوش مصنوعی تجسم یافته، ایجاد نوآوری و پیشرفت در این زمینه ها است.

ترویج تحقیق و توسعه هوش مصنوعی تجسم یافته

متا نه تنها فناوری بلکه منابعی را برای ترویج تحقیق و توسعه هوش مصنوعی تجسم یافته نیز پیش می برد. یک ابتکار کلیدی، توسعه معیارهایی برای ارزیابی مدل‌های هوش مصنوعی است. یکی از این معیارها، PARTNR (Planning And Reasoning Tasks in HumaN-Robot collaboration)، نحوه تعامل مدل‌های هوش مصنوعی با انسان‌ها را در طول کارهای خانگی ارزیابی می‌کند. با استفاده از شبیه ساز Habitat 3.0، PARTNR یک محیط واقعی را فراهم می کند که در آن ربات ها در انجام کارهایی مانند تمیز کردن و پخت و پز کمک می کنند. با بیش از 100000 کار مبتنی بر زبان، هدف آن تسریع پیشرفت در هوش مصنوعی تجسم یافته است.

علاوه بر ابتکارات داخلی، متا با سازمان هایی مانند شرکت GelSight و رباتیک وونیک برای تسریع پذیرش فناوری های حسگر لمسی. GelSight حسگرهای Digit 360 را توزیع خواهد کرد، در حالی که Wonik Robotics آلگرو Hand را تولید خواهد کرد که فناوری Digit Plexus را ادغام می کند. با در دسترس قرار دادن این فناوری‌ها از طریق پلتفرم‌های منبع باز و مشارکت، متا به ایجاد اکوسیستمی کمک می‌کند که می‌تواند به نوآوری‌هایی در مراقبت‌های بهداشتی، تولید و کمک‌های داخلی منجر شود.

خط پایین

متا در حال پیشرفت هوش مصنوعی تجسم یافته است و آن را فراتر از بینایی و صدا می برد و حس لامسه را نیز شامل می شود. با نوآوری هایی مانند Digit 360 و Sparsh، سیستم های هوش مصنوعی توانایی احساس و پاسخگویی دقیق به محیط اطراف خود را به دست می آورند. متا با به اشتراک گذاری این فناوری ها با جامعه متن باز و مشارکت با سازمان های کلیدی، به تسریع توسعه حس لامسه کمک می کند. این پیشرفت می‌تواند به پیشرفت‌هایی در زمینه‌هایی مانند مراقبت‌های بهداشتی، تولید، و کمک‌های خانگی منجر شود و هوش مصنوعی را در کارهای دنیای واقعی توانمندتر و پاسخگوتر کند.



منبع:unite.ai

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *