به گزارش مجله خبری نگار/ایتنا،تحقیقات جدید مرکز تاو برای روزنامهنگاری دیجیتال نشان میدهد که موتورهای جستجوی مبتنی بر هوش مصنوعی در ۶۰ درصد مواقع نتایج نادرست ارائه میدهند. این تحقیق هشت موتور جستجوی AI، از جمله ChatGPT Search، پرپلکسیتی، جمینای، و گروک را ارزیابی کرده و مشخص کرده است که اغلب این ابزارها اطلاعات نادرست را با اطمینان بالا ارائه میدهند.
محققان ۲۰۰ مقاله خبری از ۲۰ رسانه مختلف را بررسی کردند و صحت پاسخهای AI را بر اساس استناد به مقاله، سازمان خبری، و URL آن سنجیدند. نتایج نشان داد که تنها پرپلکسیتی و پرپلکسیتی پرو عملکرد نسبتاً بهتری داشتند، در حالی که سایر موتورهای جستوجو مانند ChatGPT Search و Grok-۳ دقت بسیار پایینی داشتند.
ChatGPT Search در ۵۷ درصد موارد کاملاً نادرست بود و تنها در ۲۸ درصد مواقع به طور کامل صحیح پاسخ داد. با این حال، این ابزار تنها مدلی بود که به همه ۲۰۰ جستوجو پاسخ داد. در مقابل، Grok-۳ از شرکت X (توییتر سابق) در ۹۴ درصد موارد پاسخهای نادرست ارائه داد، و کوپایلوت مایکروسافت نیز از ۲۰۰ جستوجو، ۱۰۴ مورد را بیپاسخ گذاشت.
این مطالعه نگرانیهای موجود درباره «توهمات» هوش مصنوعی را تأیید میکند، چرا که این مدلها حتی زمانی که اشتباه میکنند، با اطمینان کامل از درستی پاسخهای خود دفاع میکنند. با وجود این میزان خطا، شرکتهای فناوری همچنان برای ارائه نسخههای بهروزتر این ابزارها هزینههای بالایی (بین ۲۰ تا ۲۰۰ دلار در ماه) از کاربران دریافت میکنند، بدون اینکه بهطور شفاف به ضعفهای مدلهای خود اشاره کنند.
در حالی که برخی کارشناسان، مانند لنس اولانوف از TechRadar، از عملکرد سریع و بدون تبلیغ ChatGPT Search راضی هستند، اما دادههای این تحقیق نشان میدهد که کاربران باید نسبت به دقت اطلاعات ارائهشده توسط هوش مصنوعی محتاط باشند.