Skywork AI正式推出全新多模态视频基础模型SkyReels V4。该模型采用创新的双流多模态扩散Transformer(MMDiT)架构,是全球首个可同时处理多模态输入、联合生成视频与音频,并统一完成视频生成、修复、编辑三大任务的模型。它支持文本、图像、视频、音频、掩码等多种输入形式,能够输出1080p分辨率、32FPS、时长15秒的高质量音视频同步内容。