站長之家(chinaz.com)12月16日 消息:阿里巴巴重磅推出新一代通義萬相2.6系列模型,在專業影視製作與圖像創作領域實現了突破性升級,為行業帶來了全新的技術解決方案。
通義萬相2.6系列模型的一大亮點在於,它是國內首個支持角色扮演功能的視頻生成模型。這一創新功能融合了音畫同步、多鏡頭生成、聲音驅動等核心技術,構建起當前全球功能最為完整的視頻生成體系。在模型結構方面,通義萬相2.6集成了多項前沿創新技術。它能夠對輸入的參考視頻進行多模態聯合建模與深度學習,精準捕捉具有時序信息的主體情緒、姿態,以及多角度的全面視覺特徵。
同時,該模型還能提取音色、語速等聲學特徵,並在生成階段將這些特徵作為參考條件進行精準控制,從而實現了從畫面到聲音的全感官、全維度一致性保持與遷移。目前,萬相2.6已能夠支持單人和多人的表演場景,為視頻創作提供了更豐富的可能性。
此次發布的通義萬相2.6在性能上也有了顯著提升。它進一步優化了畫質、音效以及指令遵循等能力,單次視頻生成時長達到了國內最高的15秒,為用戶提供了更充裕的創作空間。此外,萬相2.6還新增了角色扮演和分鏡控制兩大核心功能。藉助角色扮演功能,用戶可以一鍵完成單人、多人以及人與物合拍的視頻創作,極大地簡化了創作流程。而分鏡控制功能則能夠自動實現多鏡頭切換等專業任務,精準滿足專業影視級場景的嚴苛需求。
目前,用戶可通過訪問萬相官網(https://tongyi.aliyun.com/wan/)了解更多相關信息。