به گزارش مجله خبری نگار،این مطالعه که در مجله Nature Neuroscience منتشر شد، توسط جری تانگ، دانشجوی دکترای علوم کامپیوتر و الکس هاث، استادیار علوم اعصاب و علوم کامپیوتر در دانشگاه UT Austin هدایت شد. این کار تا حدی بر یک مدل ترانسفورماتور متکی است، شبیه به مدلهایی که ChatGPT در Open AI و Bard Google را تامین میکنند.
برخلاف دیگر سیستمهای رمزگشایی زبان در حال توسعه، این سیستم نیازی به کار گذاشتن ایمپلنت به وسیله جراحی برای افراد ندارد و این فرآیند را غیرتهاجمی اجرا میکند. شرکت کنندگان همچنین نیازی به استفاده از کلمات از لیست تعیین شده ندارند. فعالیت مغز با استفاده از یک اسکنر fMRI پس از آموزش گسترده رمزگذاری شده اندازه گیری میشود که در آن فرد ساعتها به پادکستهای موجود در اسکنر گوش میدهد. بعداً، مشروط بر اینکه شرکتکننده برای رمزگشایی افکار خود آماده باشد، گوش دادن به یک داستان جدید یا تصور داستان نقل شده، به ماشین این امکان را میدهد تا متن مربوطه را تنها از فعالیت مغز تولید کند.
هاث گفت: برای یک روش غیرتهاجمی، این یک جهش واقعی به جلو در مقایسه با آنچه قبلا انجام شده است، که معمولا کلمات یا جملات کوتاه هستند، میباشد. ما در حال دریافت مدلی برای رمزگشایی زبان پیوسته برای مدت زمان طولانی با ایدههای پیچیده هستیم.
نتیجه یک رونوشت کلمه به کلمه نیست. در عوض، محققان آن را به گونهای طراحی کردند که اصل چیزی که گفته میشود یا فکر میشود، هر چند ناقص، به متن تبدیل شود. تقریباً نیمی از زمانهایی که رمزگشا برای نظارت بر فعالیت مغز شرکتکننده آموزش دیده است، دستگاه متنی را تولید میکند که دقیقاً با معانی مورد نظر کلمات اصلی مطابقت دارد.
برای مثال، در آزمایشها، شرکتکنندهای که به سخنران گوش میدهد و میگوید: «هنوز گواهینامه رانندگیام را ندارم»، افکارش به این صورت ترجمه میشد: «او هنوز شروع به یادگیری رانندگی نکرده است». گوش دادن به کلمات «نمیدانستم فریاد بزنم، گریه کنم یا فرار کنم. در عوض، گفتم: مرا رها کن!» به این صورت رمزگشایی شد: «شروع کرد به جیغ زدن و گریه کردن، و بعد او فقط گفت: من به تو گفتم که مرا تنها بگذار.»
با شروع نسخه قبلی مقاله که به صورت پیش چاپ آنلاین منتشر شد، محققان به سوالاتی در مورد سوء استفاده احتمالی از فناوری پرداختند. این مقاله توضیح میدهد که چگونه رمزگشایی تنها با مشارکتکنندگانی که با میل در آموزش رمزگشا شرکت کردهاند، کار میکند. نتایج برای افرادی که رمزگشا بر روی آنها آموزش ندیده بود، نامفهوم بود، و اگر شرکتکنندگانی که رمزگشا بر روی آنها آموزش دیده بود، بعداً مقاومت کردند، مثلاً با فکر کردن به افکار دیگر، نتایج بهطور مشابه غیرقابل استفاده بودند.
تانگ گفت: ما نگرانیها را در مورد استفاده از آن برای مقاصد بد بسیار جدی میگیریم و برای جلوگیری از آن تلاش کردهایم. ما میخواهیم مطمئن شویم که مردم فقط زمانی که بخواهند از این نوع فناوریها استفاده میکنند و این به آنها کمک میکند.
علاوه بر اینکه شرکتکنندگان به داستانها گوش میدادند یا درباره آنها فکر میکردند، محققان از آزمایش شوندگان خواستند تا چهار ویدیوی کوتاه و بیصدا را در حین حضور در اسکنر تماشا کنند. رمزگشای معنایی توانست از فعالیت هوش مصنوعی خود برای توصیف دقیق رویدادهای خاص از ویدیوها استفاده کند.
این سیستم در حال حاضر برای استفاده در خارج از آزمایشگاه عملی نیست، زیرا به زمان نیاز به دستگاه fMRI وابسته است. اما محققان فکر میکنند که این کار میتواند به سایر سیستمهای تصویربرداری مغز قابل حملتر، مانند طیفسنجی عملکردی مادون قرمز نزدیک (fNIRS) منتقل شود.
هاث گفت: fNIRS جایی که جریان خون کم و بیش در مغز در مقاطع مختلف زمانی وجود دارد را اندازه گیری میکند، که به نظر میرسد دقیقاً همان سیگنالی است که fMRI اندازه گیری میکند. بنابراین، نوع دقیق رویکرد ما باید به fNIRS ترجمه شود، اگرچه، او خاطرنشان کرد، وضوح با fNIRS کمتر خواهد بود