به گزارش مجله خبری نگار، شرکت هوش مصنوعی xAI ایلان ماسک، از یک فناوری چندوجهی جدید رونمایی کرده است که میتواند متن و پرسوجوهای صوتی را فوراً به تصاویر و سپس به ویدیوهایی با صدا تبدیل کند. به گزارش IXBT، این ابزار اکنون برای مشترکین Grok Heavy در دسترس است و یکی از ویژگیهای کلیدی هوش مصنوعی Grok محسوب میشود.
به گفته ایلان ماسک، این فناوری سرعت بیسابقهای در تولید محتوای بصری فراهم میکند - از ایجاد تصویر تا ویدیوی نهایی با همراهی صدا، کمتر از ۳۰ ثانیه طول میکشد که به گفته او، «سریعتر از سایر سرویسهای هوش مصنوعی است که برای تولید یک تصویر واحد نیاز دارند».
مکانیسم عملیات با یک درخواست متنی (یا صوتی) از کاربر آغاز میشود - سیستم بر اساس آن چندین گزینه تصویر ارائه میدهد. کاربر میتواند پارامترهای اضافی، از جمله ویژگیها یا عناصر سبکی را تنظیم کند. بنابراین، هنگام وارد کردن درخواست "یک پنگوئن بکشید"، سیستم مجموعهای از تصاویر را ارائه میدهد که سپس میتواند، به عنوان مثال، با یک کلاه سیلندری، عینک تک چشمی یا اشیاء دیگر تکمیل شود.