به گزارش مجله خبری نگار/سیتنا، روش جدید به مدلها امکان میدهد تا چندین گزینه را پردازش و ارزیابی و سپس پاسخ نهایی را انتخاب کنند، که مشابه حل مسئله توسط انسان است.
ظهور مدلهای زبانی بزرگ با پیچیدگی فزاینده باعث شده تا شرکتهای هوش مصنوعی مانند «اوپن اِیآی» به دنبال روشهای جدید آموزش باشند تا کارایی را بهبود بخشند و بر محدودیتهای موجود در افزایش مقیاس این مدلها غلبه کنند.
بهطور معمول، افزایش مقیاس شامل افزودن دادهها و قدرت پردازشی بیشتر بوده است. این راهبردی است که پیشرفتهای قابلتوجهی ایجاد کرده است، اما اکنون، به گفته برخی دانشمندان برجسته هوش مصنوعی، از بازدهی آن کاسته شده است.
ایلیا سوتسکور، یکی از بنیانگذاران اوپن اِیآی، اخیراً گفته نتایج حاصل از افزایش مقیاس پیشآموزش – فرآیندی که در آن مدلها الگوهای زبانی را از مجموعهدادههای عظیم یاد میگیرند – به حالت ایستایی رسیده است و نیاز به رویکردهای جایگزین وجود دارد.
یکی از این رویکردها، که در مدل جدید اوپن اِیآی به نام «o۱» استفاده شده، شامل روشی به نام «محاسبات زمان آزمایش» است. این روش به مدلها امکان میدهد تا چندین گزینه را پردازش و ارزیابی کنند و سپس پاسخ نهایی را انتخاب کنند، که مشابه حل مسئله توسط انسان است.
بهعنوان مثال، مدلی که در حال پردازش وظیفهای پیچیده مانند بازی پوکر است، میتواند زمان بیشتری را صرف «فکر کردن» درباره استراتژیهای مختلف کند و نتایجی مشابه افزایش مقیاس مدل با عوامل قابل توجه به دست آورد. این قابلیت که «استدلال چند مرحلهای» نامیده میشود، به دادهها و بازخوردهای دقیق و تحت نظر کارشناسان متکی است و دقت مدل را در وظایف پیچیده افزایش میدهد.
پیدایش روشهای جدید میتواند چشمانداز هوش مصنوعی را دگرگون کند. آموزش مدلهای زبانی بزرگ معمولاً به منابع سختافزاری عظیمی نیاز دارد، بهویژه تراشههای هوش مصنوعی که به یکی از ارکان اصلی برای پیشآموزش تبدیل شدهاند.
اما محاسبات زمان آزمایش، بیشتر به سرورهای توزیعشده و مبتنی بر ابر نیاز دارد و احتمالاً تقاضا را از خوشههای آموزشی به سیستمهای استنتاج تغییر میدهد. این تغییر ممکن است بر تولیدکنندگان تراشه مانند «انویدیا» که محصولاتشان غالب است تأثیر منفی بگذارد، اما میتواند باعث افزایش رقابت در حوزه استنتاج شود.