به گزارش مجله خبری نگار/ایتنا،دانشگاه «امآیتی» (MIT) یک مدل جدید را برای آموزش رباتها به نمایش گذاشته است. این روش به جای مجموعه استاندارد دادههای متمرکز که برای آموزش وظایف جدید به رباتها استفاده میشود، حجم بزرگی از اطلاعات مورد استفاده را برای آموزش مدلهای زبانی بزرگ به کار میگیرد.
پژوهشگران خاطرنشان کردند که یادگیری تقلیدی –یادگیری عامل با پیروی از شخص انجامدهنده کار- با مطرح شدن چالشهای کوچک ممکن است شکست بخورد. این چالشها میتوانند چیزهایی مانند نورپردازی، محیط متفاوت یا موانع جدید باشند. در این سناریوها، رباتها به سادگی دادههای کافی را برای تطبیق با چالشها در اختیار ندارند.
این گروه پژوهشی به مدلهایی مانند GPT-۴ به عنوان رویکردی برای حل مسئله نگاه کردند. «لیروی وانگ» (Lirui Wang) پژوهشگر ارشد این پروژه گفت: در حوزه زبان، دادهها فقط جملات هستند. در حوزه رباتیک با توجه به همه ناهمگونیهای موجود در دادهها، اگر بخواهیم پیشآموزش را به یک روش انجام دهیم، به روش متفاوتی نیاز داریم.
این گروه پژوهشی یک روش جدید را به نام «ترانسفورماتورهای پیشآموزش ناهمگون» (HPT) معرفی کردند که اطلاعات را از حسگرها و محیطهای گوناگون جمعآوری میکنند. سپس از یک ترانسفورماتور برای جمعآوری دادهها در مدلهای آموزشی استفاده شد. هرچه ترانسفورماتور بزرگتر باشد، خروجی بهتری دارد. کاربران در مرحله بعد، طراحی ربات، پیکربندی و کاری را که میخواهند انجام شود، وارد میکنند.