به گزارش مجله خبری نگار/برنا،آزمایشگاهها و استارتاپهای هوش مصنوعی در سیلیکونولی تمرکز خود را روی محیطهای یادگیری تقویتی (RL) گذاشتند که این محیطها عاملهای هوش مصنوعی را در شبیهسازی وظایف واقعی آموزش میدهند. این تکنیک میتواند عاملها را برای انجام کارهای پیچیده در نرمافزارها و ابزارهای مختلف آماده کند.
به گزارش تک کرانچ، استارتاپهایی مانند Mechanize و Prime Intellect در تلاشند با ایجاد محیطهای RL مقاوم و تخصصی، جایگاه خود را در این حوزه تثبیت کنند، در حالی که شرکتهای بزرگ برچسبگذاری داده مانند Surge و Mercor نیز سرمایهگذاریهای گستردهای انجام دادهاند. طبق گزارشها، Anthropic قصد دارد بیش از یک میلیارد دلار در سال آینده روی محیطهای RL سرمایهگذاری کند.
محیطهای RL به عاملهای هوش مصنوعی امکان میدهند در شبیهسازیها با ابزارها و نرمافزارها تعامل کنند و در صورت موفقیت پاداش دریافت کنند، مشابه آموزش عملی در دنیای واقعی. با وجود پتانسیل بالای این تکنیک، برخی کارشناسان هشدار میدهند که چالشهایی مانند «تقلب عاملها برای دریافت پاداش» هنوز وجود دارد و مقیاسپذیری این روش هنوز نامشخص است.
با این حال، بسیاری از پژوهشگران و سرمایهگذاران امیدوارند محیطهای RL بتوانند نسل بعدی عاملهای هوش مصنوعی با قابلیتهای عمومیتر را شکل دهند و صنعت هوش مصنوعی را وارد مرحلهای جدید کنند.