به گزارش مجله خبری نگار/بهار، شرکت متا با گنجاندن حس لامسه و احساس در نوآوریهای رباتیک خود، روی حوزه نوظهور هوش مصنوعی تجسم یافته کار میکند.
این غول فناوری با شرکت حسگرسازی ژلسایت (GelSight) مستقر در ایالات متحده و شرکت رباتیک وونیک روبوتیکس (Wonik Robotics) در کره جنوبی برای تجاریسازی حسگرهای لمسی برای هوش مصنوعی همکاری میکند. گفتنی است که این حسگرهای جدید برای مصرف کنندگان طراحی نشدهاند، بلکه برای دانشمندان طراحی میشوند.
در این راستا، متا سه فناوری تحقیقاتی موسوم به اسپارش (Sparsh)، دیجیت ۳۶۰ (Digit ۳۶۰) و دیجیت پلکسوز (Digit Plexus) را منتشر کرده است که بر درک لمس، مهارت ربات و تعامل انسان و ربات تمرکز دارند. علاوه بر این، این شرکت در حال معرفی یک معیار جدید برای ارزیابی برنامهریزی و استدلال در همکاری انسان و ربات به نام «وظایف برنامهریزی و استدلال در همکاری انسان و ربات» (PARTNR) است.
رباتهایی که برای انجام کارها نیاز به استدلال دارند
این پیشرفتهای جدید مبتنی بر این خواسته است که مدلهای پایه از جمله مدلهای زبان بزرگ (LLMs) و مدلهای زبان بینایی (VLM) بتوانند رباتها را قادر به انجام کارهای پیچیدهتر کنند که نیاز به استدلال و برنامهریزی دارند.
فناوری «اسپارش» که با مشارکت دانشگاه واشنگتن و دانشگاه کارنگی ملون توسعه یافته است، مجموعهای از مدلهای رمزگذار طراحی شده برای حس لامسه مبتنی بر بینایی است که هدف آن ارائه قابلیتهای درک لمسی به رباتهاست. این توانایی برای کارهای مختلف رباتیک مانند سنجش میزان فشاری که میتوان به یک جسم وارد کرد، بدون اینکه آسیبی به آن وارد شود، ضروری است.
فناوری «دیجیت ۳۶۰» نیز یک حسگر لمسی مصنوعی به شکل انگشت است که دارای بیش از ۱۸ قابلیت حسی و بیش از ۸ میلیون تکسل (taxel) (یک عنصر لمسی در رباتیک) برای ثبت تغییر شکلهای همهجانبه و دانهای در نوک انگشت ربات است. این طراحی به درک دقیقتری از تعاملات محیطی و دستکاری اشیاء منجر میشود.
این حسگر همچنین شامل مدلهای هوش مصنوعی روی دستگاه است که وابستگی به سرورهای ابری را به حداقل میرساند و پردازش محلی را برای پاسخهای سریع لمسی، مشابه با انسان و حیوانات فعال میکند.
فناوری «دیجیت پلکسوز» هم یک سکوی سخت افزاری-نرم افزاری است که توسعه برنامههای رباتیک را ساده میکند. این فناوری اجازه میدهد تا حسگرهای مختلف نوک انگشت و پوست در یک دست ربات ادغام شوند و دادههای لمسی را رمزگذاری و از طریق یک کابل به رایانه میزبان منتقل کنند. شرکت متا امیدوار است با به اشتراک گذاشتن کد و طراحی برای «دیجیت پلکسوز» به پژوهشگران در پیشرفت مهارت رباتها کمک کند.
معیاری جدید برای ارزیابی مدلهای هوش مصنوعی
متا همچنین در حال راهاندازی «وظایف برنامهریزی و استدلال در همکاری انسان و ربات» (PARTNR) است که معیاری برای ارزیابی میزان کمک مدلهای هوش مصنوعی به انسان در انجام وظایف خانهداری است.
PARTNR مبتنی بر هبیتت (Habitat)، محیط شبیهسازی شده متا است و شامل ۱۰۰ هزار تکلیف زبان طبیعی در ۶۰ وظیفه خانهداری است که شامل بیش از ۵۸۰۰ شیء منحصر به فرد است. این معیار طراحی شده است تا ارزیابی کند که مدلهای زبان بزرگ و مدلهای زبان بینایی چگونه به طور مؤثر دستورالعملهای انسانی را دنبال میکنند.
این معیار جدید به روند رو به رشد پروژههای پژوهش درباره استفاده از مدلهای زبان بزرگ و مدلهای زبان بینایی در رباتیک و هوش مصنوعی تجسم یافته میافزاید.
این مدلها در طول سال گذشته پتانسیل قابل توجهی را به عنوان اجزای برنامهریزی و استدلال برای رباتهایی که وظایف پیچیده را انجام میدهند، نشان دادهاند.
مت میگوید هدف ما با PARTNR ایجاد پیشرفت در تعامل انسان و ربات و هوش مشترک است و مدلهای هوش مصنوعی را از یک «عامل» به یک «شریک» تبدیل میکند.