کد مطلب: ۴۳۹۲۹۸
۱۳ ارديبهشت ۱۴۰۲ - ۰۹:۴۶

هوش مصنوعی به افرادی که قدرت تکلم ندارند کمک میکند

یک سیستم هوش مصنوعی جدید به نام رمزگشای معنایی می‌تواند فعالیت مغز یک فرد را، در حین گوش دادن به یک داستان یا تصور ذهنی از شنیدن یک داستان، به یک جریان متنی پیوسته تبدیل کند. سیستم توسعه یافته توسط محققان دانشگاه تگزاس در آئوستین ممکن است به افرادی که هوشیاری ذهنی دارند و در عین حال قادر به صحبت کردن فیزیکی نیستند، مانند افرادی که در اثر سکته مغزی ضعیف شده‌اند، کمک کند تا دوباره به طور قابل درک با دیگران ارتباط برقرار کنند.

به گزارش مجله خبری نگار،این مطالعه که در مجله Nature Neuroscience منتشر شد، توسط جری تانگ، دانشجوی دکترای علوم کامپیوتر و الکس هاث، استادیار علوم اعصاب و علوم کامپیوتر در دانشگاه UT Austin هدایت شد. این کار تا حدی بر یک مدل ترانسفورماتور متکی است، شبیه به مدل‌هایی که ChatGPT در Open AI و Bard Google را تامین می‌کنند.

برخلاف دیگر سیستم‌های رمزگشایی زبان در حال توسعه، این سیستم نیازی به کار گذاشتن ایمپلنت به وسیله جراحی برای افراد ندارد و این فرآیند را غیرتهاجمی اجرا می‌کند. شرکت کنندگان همچنین نیازی به استفاده از کلمات از لیست تعیین شده ندارند. فعالیت مغز با استفاده از یک اسکنر fMRI پس از آموزش گسترده رمزگذاری شده اندازه گیری می‌شود که در آن فرد ساعت‌ها به پادکست‌های موجود در اسکنر گوش می‌دهد. بعداً، مشروط بر اینکه شرکت‌کننده برای رمزگشایی افکار خود آماده باشد، گوش دادن به یک داستان جدید یا تصور داستان نقل شده، به ماشین این امکان را می‌دهد تا متن مربوطه را تنها از فعالیت مغز تولید کند.

هاث گفت: برای یک روش غیرتهاجمی، این یک جهش واقعی به جلو در مقایسه با آنچه قبلا انجام شده است، که معمولا کلمات یا جملات کوتاه هستند، می‌باشد. ما در حال دریافت مدلی برای رمزگشایی زبان پیوسته برای مدت زمان طولانی با ایده‌های پیچیده هستیم.

نتیجه یک رونوشت کلمه به کلمه نیست. در عوض، محققان آن را به گونه‌ای طراحی کردند که اصل چیزی که گفته می‌شود یا فکر می‌شود، هر چند ناقص، به متن تبدیل شود. تقریباً نیمی از زمان‌هایی که رمزگشا برای نظارت بر فعالیت مغز شرکت‌کننده آموزش دیده است، دستگاه متنی را تولید می‌کند که دقیقاً با معانی مورد نظر کلمات اصلی مطابقت دارد.

برای مثال، در آزمایش‌ها، شرکت‌کننده‌ای که به سخنران گوش می‌دهد و می‌گوید: «هنوز گواهینامه رانندگی‌ام را ندارم»، افکارش به این صورت ترجمه می‌شد: «او هنوز شروع به یادگیری رانندگی نکرده است». گوش دادن به کلمات «نمی‌دانستم فریاد بزنم، گریه کنم یا فرار کنم. در عوض، گفتم: مرا رها کن!» به این صورت رمزگشایی شد: «شروع کرد به جیغ زدن و گریه کردن، و بعد او فقط گفت: من به تو گفتم که مرا تنها بگذار.»

با شروع نسخه قبلی مقاله که به صورت پیش چاپ آنلاین منتشر شد، محققان به سوالاتی در مورد سوء استفاده احتمالی از فناوری پرداختند. این مقاله توضیح می‌دهد که چگونه رمزگشایی تنها با مشارکت‌کنندگانی که با میل در آموزش رمزگشا شرکت کرده‌اند، کار می‌کند. نتایج برای افرادی که رمزگشا بر روی آن‌ها آموزش ندیده بود، نامفهوم بود، و اگر شرکت‌کنندگانی که رمزگشا بر روی آن‌ها آموزش دیده بود، بعداً مقاومت کردند، مثلاً با فکر کردن به افکار دیگر، نتایج به‌طور مشابه غیرقابل استفاده بودند.

تانگ گفت: ما نگرانی‌ها را در مورد استفاده از آن برای مقاصد بد بسیار جدی می‌گیریم و برای جلوگیری از آن تلاش کرده‌ایم. ما می‌خواهیم مطمئن شویم که مردم فقط زمانی که بخواهند از این نوع فناوری‌ها استفاده می‌کنند و این به آن‌ها کمک می‌کند.

علاوه بر اینکه شرکت‌کنندگان به داستان‌ها گوش می‌دادند یا درباره آن‌ها فکر می‌کردند، محققان از آزمایش شوندگان خواستند تا چهار ویدیوی کوتاه و بی‌صدا را در حین حضور در اسکنر تماشا کنند. رمزگشای معنایی توانست از فعالیت هوش مصنوعی خود برای توصیف دقیق رویداد‌های خاص از ویدیو‌ها استفاده کند.

این سیستم در حال حاضر برای استفاده در خارج از آزمایشگاه عملی نیست، زیرا به زمان نیاز به دستگاه fMRI وابسته است. اما محققان فکر می‌کنند که این کار می‌تواند به سایر سیستم‌های تصویربرداری مغز قابل حمل‌تر، مانند طیف‌سنجی عملکردی مادون قرمز نزدیک (fNIRS) منتقل شود.

هاث گفت: fNIRS جایی که جریان خون کم و بیش در مغز در مقاطع مختلف زمانی وجود دارد را اندازه گیری می‌کند، که به نظر می‌رسد دقیقاً همان سیگنالی است که fMRI اندازه گیری می‌کند. بنابراین، نوع دقیق رویکرد ما باید به fNIRS ترجمه شود، اگرچه، او خاطرنشان کرد، وضوح با fNIRS کمتر خواهد بود

ارسال نظرات
قوانین ارسال نظر