به گزارش مجله خبری نگار،با وجود موفقیتهای چشمگیر، مدلهای زبانی در مقیاس بزرگ مانند ChatGPT هنوز مستعد خطا هستند - و پاسخهای صحیح و آشکارا نادرست را با دقت نگرانکنندهای تولید میکنند. مشکل در عدم قطعیتی است که چنین مدلهایی با آن کار میکنند. با این حال، محققان سوئیسی راهی برای کاهش این عدم قطعیت پیدا کردهاند و روشی را توسعه دادهاند که به آنها امکان میدهد هوش مصنوعی را با دادههای اضافی و مرتبط "تغذیه" کنند تا پاسخهای آنها دقیقتر شود. نسخه پیشچاپ این کار در پورتال arxiv منتشر شده است.
این الگوریتم به جای تکرار ساده اطلاعات موجود، دادههایی را انتخاب میکند که بیشترین تطابق را با سوال دارند. این امر با تجزیه و تحلیل بردارهای رابطه معنایی بین کلمات در یک فضای چند بعدی حاصل میشود. هرچه بردارها در یک راستا نزدیکتر باشند، همبستگی آنها بیشتر است. با این حال، برخلاف رویکرد کلاسیک "نزدیکترین همسایه"، SIFT اطلاعات متفاوت، اما مکمل را انتخاب میکند.
برای مثال، هنگام پاسخ به این سوال که «راجر فدرر چند سال دارد و چند فرزند دارد؟»، هوش مصنوعی سنتی ممکن است در تاریخ تولد گیر کند و اطلاعات مربوط به فرزندان را نادیده بگیرد. با این حال، SIFT هم اطلاعات سن و هم اطلاعات خانواده را پیدا میکند و هر جنبه را با جنبه دیگر تکمیل میکند.
این نوآوری نه تنها کیفیت را بهبود میبخشد: اطلاعات اضافی کمتر به معنای بار کمتر روی سیستم است. SIFT اجازه میدهد تا میزان محاسبات متناسب با پیچیدگی سوال تنظیم شود و امکان ایجاد مدلهای قابل اعتماد با منابع کمتر را فراهم کند. در آزمایشها، محققان به عملکردی برتر از بهترین سیستمهای هوش مصنوعی دست یافتند، در حالی که مدل آنها ۴۰ برابر کوچکتر بود.
محققان تأکید میکنند که SIFT همچنین میتواند برای تجزیه و تحلیل دادهها مفید باشد، به عنوان مثال، برای تعیین اینکه کدام پارامترهای آزمایشگاهی برای تشخیص مهم هستند و کدامها بیاهمیت. این امر راه را برای کاربردهای جدید در پزشکی، علوم و تجارت باز میکند.