مجله خبری-سبک زندگی نگار: مردم به صورت روزانه از تلفنهای همراه خود برای تمام کارها استفاده میکنند و صد البته مایلند باتری آنها دوام و پایداری بالایی داشته و به سرعت شارژ شود. مهندسین چند راه برای دور زدن این مشکل دارند که جدای از قرار دادن باتری بزرگتر و صدالبته خطرناکتر لیتیوم یونی است. موثرترین روش، بهینهسازی حداکثر تراشهها، درایورها و دیگر اجزاء تلفنهای همراه هوشمند است. تراشه جدید MIT نیز یکی از همین راههای حل است که تا لحظاتی دیگر به آن خواهیم پرداخت.
واضحترین هدفها شامل صفحه نمایشهای بزرگ، مودمهای ۴ G و بلوتوث است. اما محققین نگاهی عمیقتر به دستیار صوتی داشتهاند که همیشه روشن است و شما را قادر به دستور دادن بدون نیاز به فشردن دکمه میکند. دستیارهای صوتی میتوانند انرژی بسیاری مصرف کنند که سبب تخلیه سریع باتری میشود، اما محققین در آزمایشگاه فناوری میکروسیستمهای MIT، راهی برای بهینه سازی آنها برای صرفه جویی در میزان مصرف باتری یافتهاند.
حال به قسمت جذاب مقاله رسیدیم تا بدانیم تراشه جدید MIT دقیقاً چه کاری انجام میدهد. الکسا (Alexa)، سیری (Siri) و دستیار صوتی گوگل (Google Assistant) از فضای ابری برای پردازش دستورات صوتی استفاده میکنند. گروه محققین MIT در روشی ماهرانه، تراشهای طراحی کردهاند که بسیاری از پردازشها را رسیدگی میکند و از باری که بر روی دوش دیگر اجزاء است، میکاهد و متعاقباً سبب ذخیره باتری میشود. مایکل پرایس، فردی که تراشه جدید MIT را طراحی کرده است میگوید:
حتی اگر صرفه جویی در مصرف باتری برای ما مسئله ساز نبود، شتاب دهندههای سخت افزاری میتوانند برای ساده سازی و مقرون به صرفه شدن دستگاهها بسیار مفید باشند. اگر بتوانید محاسبات پیچیدهای را از دوش پردازنده اصلی بردارید، دیگر نیازی نیست پردازنده به همان سرعت عمل کند.
این بدان معنی است که سازندگان میتوانند از پردازندههای ارزان قیمتتر استفاده کنند. ارزانتر خوب است، اما افزایش راندمان بهتر است و پرایس توانست کاری کند که کاهش شدیدی در میزان باتری مصرفی مورد نیاز برای ویژگیهای دستیار صوتی ایجاد شود. پرایس اذعان داشته است که تلفنهای همراه هوشمند عموماً نیاز به ۱ وات انرژی برای رساندن یک جستار تشخیص گفتار منفرد نیاز دارند. سیستمی که او و تیمش توسعه دادهاند، در بدترین حالت نیاز به ۱۰۰۰/۱ میزان از انرژی ذکر شده خواهد داشت. برخی عملکردهای پردازش صدای ساده، تنها ۰٫۲ میلی وات انرژی مصرف کردند که نشان دهنده این است که طراحی جدید، ۵۰۰۰ برابر بهینهتر از بنچمارک ۱ واتی است.
ذخیره انرژی اصلی با افزایش مهارت تراشه در شناسایی سخن است به دست خواهد آمد. به جای پخش صدا در یک ارتباط شبکه به یک سرور، پردازنده گفتار را به صورت محلی تبدیل به متن میکند. پردازش این جستارها به عنوان یک فایل متنی، انرژی بسیار کمتری مصرف میکند. علاوه بر آن، سیستم ذخیره انرژی بیشتری را در زمان تشخیص گفتار خواهد داشت، زیرا یک مدار کم مصرف در درون تراشه، تشخیص میدهد که چه زمانی نویز محیطی توسط صدا قطع میشود، سپس سیستم اصلی را زمانی که یک دستور صوتی ثبت میشود، فعال میکند.
پردازندهی تحقیقاتی، شامل یک اکتشاف متضاد هم بود. گروه پرایس ۳ مدار را مورد بررسی قرار دادند و کشف کردند که پرمصرفترینِ آنها، بیشترین ذخیره انرژی را داشت. چرا؟ زیرا مثبتهای کاذب کمتری نسبت به مدارهای دیگر ثبت میکرد که اغلب تراشهی پردازش صدا را پس از تشخیص اشتباه صدای محیط به عنوان دستور صوتی، فعال میکردند.
نیاز اندک این تراشه به انرژی، بدین معنی است که میتوانید تواناییهای کنترل صوتی که این تراشه ارائه میدهد را در موج بعدی دستگاههای IoT (Internet of Things) با باتریهای کوچک مشاهده کنید. اما با این وجود، پرایس نظری درمورد این که آیا این فناوری را به زودی در محصولات مصرف کننده مشاهده خواهید کرد یا خیر، نداد. تراشهی توسعه یافته توسط MIT، اختصاصاً برای گجتهایی طراحی شده است که باتری دارند، اما عملکرد محصولات مشابه همانند Amazon Echo و Google Home هم میتوانند تحت تاثیر این فناوری قرار گیرند.
پرایس میگوید:
اگر یک محصول خانگی به صورت محلی تشخیص صدا میدهد و پردازش دشواری دارد، فناوری ما میتواند برای این محصول مفید باشد.
کلیپهای صوتی ذخیره شده توسط Echo (اکو)ی شما حتی پس از پردازش شدن، در سرورهای شرکت باقی میمانند. آمازون و گوگل، سابقهی حفاظت از امنیت و حفظ حریم خصوصی فوق العادهای دارند، اما هرچه فرایند بیشتری بر روی دستگاه انجام شود، به معنی این است که اطلاعات شخصی کمتری در فضای ابری ذخیره خواهد شد. پرایس اذعان داشت که تبدیل صدا به متن بر روی دستگاه پیش از فرستادن آن به یک سرور، برخی اطلاعات همانند سن گوینده، لحجه، جنسیت و صدای محیط پس زمینه را از دادهی ذخیره شده حذف میکند که سبب افزایش امنیت مصرف کننده خواهد شد.
پرایس میگوید:
قطعاً حریم شخصی، بسته به طراح دارد و هیچ موردی آنها را از ذخیره صدا بر روی یک دستگاه یا انتقال آن باز نمیدارد حتی اگر تشخیص صدا به صورت محلی صورت بگیرد.
این موضوع صحیح است، اما هر فناوری که دستورات صوتی را بهینهتر میکند، خوب است.