کد مطلب: ۷۱۹۸۷۷

|

|

نگارمگ اخبار اخبار علمی آموزشی

۲۴ آبان ۱۴۰۳ - ۱۱:۵۱

تلاش برای آموزش فراتر مدل‌های زبانی بزرگ!

ظهور مدل‌های زبانی بزرگ با پیچیدگی فزاینده باعث شده تا شرکت‌های هوش مصنوعی مانند اوپن ای‌آی به دنبال روش‌های جدید آموزش باشند تا کارایی را بهبود بخشند و بر محدودیت‌های موجود در افزایش مقیاس این مدل‌ها غلبه کنند.

به گزارش مجله خبری نگار/سیتنا، روش جدید به مدل‌ها امکان می‌دهد تا چندین گزینه را پردازش و ارزیابی و سپس پاسخ نهایی را انتخاب کنند، که مشابه حل مسئله توسط انسان است.

ظهور مدل‌های زبانی بزرگ با پیچیدگی فزاینده باعث شده تا شرکت‌های هوش مصنوعی مانند «اوپن اِی‌آی» به دنبال روش‌های جدید آموزش باشند تا کارایی را بهبود بخشند و بر محدودیت‌های موجود در افزایش مقیاس این مدل‌ها غلبه کنند.

به‌طور معمول، افزایش مقیاس شامل افزودن داده‌ها و قدرت پردازشی بیشتر بوده است. این راهبردی است که پیشرفت‌های قابل‌توجهی ایجاد کرده است، اما اکنون، به گفته برخی دانشمندان برجسته هوش مصنوعی، از بازدهی آن کاسته شده است.

ایلیا سوتسکور، یکی از بنیان‌گذاران اوپن اِی‌آی، اخیراً گفته نتایج حاصل از افزایش مقیاس پیش‌آموزش – فرآیندی که در آن مدل‌ها الگو‌های زبانی را از مجموعه‌داده‌های عظیم یاد می‌گیرند – به حالت ایستایی رسیده است و نیاز به رویکرد‌های جایگزین وجود دارد.

یکی از این رویکردها، که در مدل جدید اوپن اِی‌آی به نام «o۱» استفاده شده، شامل روشی به نام «محاسبات زمان آزمایش» است. این روش به مدل‌ها امکان می‌دهد تا چندین گزینه را پردازش و ارزیابی کنند و سپس پاسخ نهایی را انتخاب کنند، که مشابه حل مسئله توسط انسان است.

به‌عنوان مثال، مدلی که در حال پردازش وظیفه‌ای پیچیده مانند بازی پوکر است، می‌تواند زمان بیشتری را صرف «فکر کردن» درباره استراتژی‌های مختلف کند و نتایجی مشابه افزایش مقیاس مدل با عوامل قابل توجه به دست آورد. این قابلیت که «استدلال چند مرحله‌ای» نامیده می‌شود، به داده‌ها و بازخورد‌های دقیق و تحت نظر کارشناسان متکی است و دقت مدل را در وظایف پیچیده افزایش می‌دهد.

پیدایش روش‌های جدید می‌تواند چشم‌انداز هوش مصنوعی را دگرگون کند. آموزش مدل‌های زبانی بزرگ معمولاً به منابع سخت‌افزاری عظیمی نیاز دارد، به‌ویژه تراشه‌های هوش مصنوعی که به یکی از ارکان اصلی برای پیش‌آموزش تبدیل شده‌اند.

اما محاسبات زمان آزمایش، بیشتر به سرور‌های توزیع‌شده و مبتنی بر ابر نیاز دارد و احتمالاً تقاضا را از خوشه‌های آموزشی به سیستم‌های استنتاج تغییر می‌دهد. این تغییر ممکن است بر تولیدکنندگان تراشه مانند «انویدیا» که محصولاتشان غالب است تأثیر منفی بگذارد، اما می‌تواند باعث افزایش رقابت در حوزه استنتاج شود.

لینک کپی شد

اشتراک‌ گذاری

۰ پسندیدم

گزارش خطا

برچسب ها: هوش مصنوعی

ارسال نظرات

انتشار یافته: ۰ |

در انتظار بررسی: ۰ |

غیر قابل انتشار: ۰

قوانین ارسال نظر