به گزارش مجله خبری نگار/اقتصاد آنلاین، امروز شایعهای درخصوص عرضه نسل بعدی هوش مصنوعی DeepSeek با نام R۲ مطرح شد. گفته میشد این مدل در اواخر ماه آگوست عرضه خواهد شد، اما تنها چند ساعت بعد، یک منبع نزدیک به DeepSeek این شایعه را تکذیب کرد و تاکید کرد که هیچ برنامهای برای عرضه R۲ در این بازه زمانی وجود ندارد. این اولین بار نیست که برنامههای DeepSeek موجب سردرگمی کاربران و تحلیلگران میشود. پیشتر نیز شایعاتی درخصوص عرضه مدل R۲ در ۱۷ مارس منتشر شده بود که صحت نداشت. این شرکت هنوز درخصوص تاریخ رسمی رونمایی و جزئیات فنی کلیدی این مدل اطلاعاتی را اعلام نکرده است.
R۲ قرار است تواناییهای چندزبانه و تولید کد را به طرز چشمگیری ارتقا دهد و با مدلهای پیشرفتهای مانند GPT-۴/۵ رقابت کند. با این حال، طبق گزارشهایی که در ماه ژوئن در وبسایت خبری The Information منتشر شد، مدیرعامل DeepSeek، لیانگ ونفنگ، حتی پس از ماهها توسعه، از عملکرد این مدل رضایت ندارد.
عرضه R۲ تنها به دلیل بهینهسازی به تاخیر نیفتاده و مشکلات زیرساختی نیز در این موضوع دخیل هستند. DeepSeek به دلیل محدودیت دسترسی به توان محاسباتی، بهویژه پس از ممنوعیت صادرات تراشههای H۲۰ انویدیا به چین، با محدودیت مواجه شده است. به نظر میرسد این شرکت نگران است که عرضه زودهنگام R۲ و افزایش ناگهانی کاربران، سیستمهایش را تحت فشار قرار دهد.
در رقابت شدید هوش مصنوعی، تنها عملکرد مدل کافی نیست و مقیاس پذیری نیز از اهمیت ویژهای برخوردار است. برای جبران محدودیتهای محاسباتی، DeepSeek reportedly در حال آموزش مدل R۲ روی تراشههای Ascend ۹۱۰B هوآوی است.
به نظر میرسد وضعیت تامین تراشهها در آینده نزدیک بهبود یابد. تنها چند روز پیش، انویدیا و AMD توافق درآمدی با دولت آمریکا امضا کردند که به آنها اجازه میدهد تراشههای هوش مصنوعی را در چین بفروشند، البته در ازای واگذاری ۱۵٪ از درآمد خود در این کشور. این اقدام میتواند محدودیتهای پیش روی شرکتهایی مانند DeepSeek را کاهش دهد، با این حال، اثر آن بلافاصله قابل مشاهده نخواهد بود.
R۲ واقعی است و در حال آزمایش قرار دارد، اما هنوز آماده عرضه نیست. DeepSeek به مدلی توانمند، پایدار و مقیاسپذیر نیاز دارد و جهان منتظر است ببیند آیا R۲ میتواند انتظارات را برآورده کند یا خیر.