به گزارش مجله خبری نگار،ما در طلوع عصر رباتیک همه منظوره زندگی میکنیم. اکنون دهها شرکت احساس کرده اند که زمان سرمایه گذاری کلان بر روی رباتهای انسان نما فرا رسیده که میتوانند به طور مستقل راه خود را در محیطهای کاری موجود بپیمایند و وظایف را از کارگران انسانی تحویل بگیرند.
برای گسترش قابلیتهای رباتها تا جایی که آنها بتوانند در هر مکان شغلی استفاده شوند و شروع به انجام وظایف مختلف کنند، به روشی برای ارتقای سریع مهارتهای خود بر اساس دستورالعملها یا نمایشهای انسانی نیاز دارند. اینجاست که تویوتا ادعا میکند با رویکرد یادگیری جدید مبتنی بر سیاست انتشار که به گفته این شرکت دری را به روی مفهوم مدلهای رفتاری بزرگ باز میکند، به پیشرفت عظیمی دست یافته است.
سیاست انتشار مفهومی است که تویوتا با مشارکت مهندسی کلمبیا و MIT توسعه داده است، اینگونه توصیف میشود: روشی جدید برای ایجاد رفتار ربات با نمایش نظارت دیداری و حرکتی یک ربات.
اساساً، جایی که مدلهای زبان بزرگ (LLM) مانند ChatGPT میتوانند میلیاردها کلمه از نوشتههای انسانی را بنوشند و به خود بیاموزند که بنویسند و کدنویسی کنند، سیاست انتشار به هوش مصنوعی رباتیک اجازه میدهد تا یک ربات تماشا کند که چگونه یک انسان یک کار فیزیکی معین را در دنیای واقعی انجام میدهد و سپس اساسا خود را طوری برنامه ریزی کند که آن کار را به شیوهای انعطاف پذیر انجام دهد.
در حالی که برخی از استارتاپها به رباتهای خود از طریق حضور از راه دور آموزش میدهند، رویکرد تویوتا بیشتر بر روی لمس متمرکز است. اپراتورها از هدست واقعیت مجازی استفاده نمیکنند، اما بازخورد لمسی را از گیرههای نرم و انعطاف پذیر ربات از طریق کنترلهای دستی خود دریافت میکنند که به آنها این امکان را میدهد تا حسی را که ربات هنگام تماس با اشیا احساس میکند، دریابند.
هنگامی که یک اپراتور انسانی به رباتها نشان داد که چگونه یک کار را در چندین زمان مختلف، در شرایط کمی متفاوت انجام دهند، هوش مصنوعی ربات مدل داخلی خود را از ظاهر موفقیت و شکست ساخته و سپس هزاران هزار بار آن را اجرا میکند.
بن بورچفیل (Ben Burchfiel) یکی از اعضای این تیم پژوهشی میگوید: فرآیند با نشان دادن مجموعه کوچکی از مهارتهای یاد دهنده از طریق عملیات از راه دور شروع میشود. سیاست انتشار مبتنی بر هوش مصنوعی ما پس از چند ساعت در پس زمینه یاد میگیرد. برای ما معمول است که بعد از ظهر به یک ربات آموزش دهیم، اجازه دهیم یک شبه یاد بگیرد و صبح روز بعد به یک رفتار جدید برسیم.
این تیم تحقیقاتی تاکنون از این روش برای آموزش سریع رباتها در بیش از ۶۰ کار کوچک و عمدتاً مبتنی بر آشپزخانه استفاده کرده است. هر کدام از این کارها برای یک انسان بالغ نسبتا ساده است، اما هر کدام از رباتها میخواهند تا خودشان بفهمند چگونه چنگ بزنند و نگه دارند و با استفاده از طیف وسیعی از ابزارها و ظروف، انواع مختلف اقلام را دستکاری کنند.
تویوتا میگوید که صدها کار را تا پایان سال تحت کنترل خواهد داشت و بیش از هزار کار را تا پایان سال ۲۰۲۴ هدف قرار داده است. به این ترتیب، این شرکت در حال توسعه چیزی است که معتقد است اولین مدل رفتار بزرگ یا LBM خواهد بود. چارچوبی که در نهایت گسترش مییابد و به چیزی شبیه ربات معادل ChatGPT تبدیل میشود. به عبارت دیگر، یک مدل کاملاً تولید شده توسط هوش مصنوعی از نحوه تعامل یک ربات با دنیای فیزیکی برای دستیابی به نتایج معین که به صورت انبوهی از دادهها و کاملاً غیرقابل درک برای چشم انسان، ظاهر میشود.
این تیم پژوهشی به طور موثر رویهای را ایجاد میکند که به موجب آن مالکان و اپراتورهای رباتهای آینده در انواع موقعیتها میتوانند به سرعت به رباتهای خود وظایف جدید را در صورت لزوم آموزش داده و کل ناوگان رباتها را با مهارتهای جدید ارتقا دهند.