به گزارش مجله خبری نگار، روزنامه فایننشال تایمز (FT) به نقل از منابع خود گزارش داد که شرکت چینی DeepSeek به دلیل مشکلات قابل توجه در آموزش با شتابدهندههای محاسباتی هواوی، انتشار مدل زبان برنامهنویسی پرچمدار جدید خود را به تعویق انداخته است.
این موضوع در بحبوحه فشارهای مقامات چینی برای تشویق توسعهدهندگان هوش مصنوعی داخلی، از جمله DeepSeek، به روی آوردن به شتابدهندههای Huawei Ascend به جای تراشههای Nvidia که به دلیل تحریمهای ایالات متحده با مشکل مواجه هستند، مطرح شده است. DeepSeek اوایل امسال با موفقیت مدل زبان R۱ را منتشر کرد و توانایی خود را در استفاده کارآمد از منابع محاسباتی محدود نشان داد.
با این حال، هنگام تلاش برای آموزش مدل جدید R۲ روی پلتفرمهای هواوی، این شرکت با مشکلات فنی جدی مواجه شد. این امر DeepSeek را مجبور کرد تا شتابدهندههای موجود هواوی را برای وظایف استنتاج (تشکیل نتیجهگیریهای منطقی) مجدداً مورد استفاده قرار دهد و آموزش R۲ حیاتی را روی تجهیزات Nvidia ادامه دهد. انتشار R۲ که در ابتدا برای ماه مه اعلام شده بود، به تعویق افتاد، که به گفته کارشناسان، بر موقعیت رقابتی DeepSeek در بازار هوش مصنوعی که به سرعت در حال توسعه است، تأثیر منفی میگذارد.
نمایندگان هواوی از مشکلات آگاه بودند و تیمی از متخصصان را به DeepSeek فرستادند. با این حال، تلاشهای آنها نتایج مطلوبی را در آموزش مدل R۲ به همراه نداشت. علاوه بر این، حتی فرآیند تطبیق تراشههای هواوی با وظایف استنتاج هنوز کامل نشده است. مدیریت DeepSeek اذعان میکند که پیشرفت فعلی در توسعه R۲ کافی نیست و به زمان بیشتری برای اصلاح نیاز دارد، اگرچه برخی منابع نسبت به انتشار قریبالوقوع این مدل ابراز امیدواری میکنند.
با وجود این چالشها، رقبای DeepSeek همچنان به پیشرفت سریع خود ادامه میدهند. به عنوان مثال، علیبابا مفاهیم کلیدی DeepSeek را در مدل Qwen۳ خود به کار گرفت و به کارایی بیشتری دست یافت. کارشناسان صنعت عموماً انتظار دارند که با گذشت زمان، توسعهدهندگان چینی بتوانند مدلهای زبانی موفقی را که کاملاً بر روی تراشههای هواوی آموزش دیدهاند، علیرغم چالشهای فعلی، ایجاد کنند.