Mochi in ComfyUI Mochi是Genmo最新推出的开源视频生成模型,它在ComfyUI中经过优化,即使使用消费级GPU也能实现。Mochi以其高保真度动作和卓越的提示遵循性而著称,为ComfyUI社区带来了最先进的视频生成能力。Mochi模型在Apache 2.0许可下发布,这意味着开发者和创作者可以自由使用、修改和集成Mochi,而不受限制性许可的阻碍。Mochi能够在消费级GPU上运行,如4090,且在ComfyUI中支持多种注意力后端,使其能够适应小于24GB的VRAM。
mochi-1-preview 这是一个先进的视频生成模型,采用 AsymmDiT 架构,可免费试用。它能生成高保真视频,缩小了开源与闭源视频生成系统的差距。模型需要至少 4 个 H100 GPU 运行。
LTXV LTXV是Lightricks推出的一个实时AI视频生成开源模型,它代表了视频生成技术的最新发展。LTXV能够提供可扩展的长视频制作能力,优化了GPU和TPU系统,大幅减少了视频生成时间,同时保持了高视觉质量。LTXV的独特之处在于其帧到帧学习技术,确保了帧之间的连贯性,消除了闪烁和场景内的不一致问题。这一技术对于视频制作行业来说是一个巨大的进步,因为它不仅提高了效率,还提升了视频内容的质量。
VideoSeal VideoSeal 是一个开源的视频水印项目,由 Facebook Research 提供。该项目包括预训练模型、训练代码、推理代码和评估工具,全部在 MIT 许可证下发布。VideoSeal 能够将信息嵌入视频内容中,用于版权保护、内容验证等目的。它支持视频和图像水印,并提供了与现有最先进图像水印技术的对比基准。VideoSeal 的主要优点包括开放性、高效性以及对视频和图像水印的双重支持。
hunyuan-video-keyframe-control-lora HunyuanVideo Keyframe Control Lora 是一个针对HunyuanVideo T2V模型的适配器,专注于关键帧视频生成。它通过修改输入嵌入层以有效整合关键帧信息,并应用低秩适配(LoRA)技术优化线性层和卷积输入层,从而实现高效微调。该模型允许用户通过定义关键帧精确控制生成视频的起始和结束帧,确保生成内容与指定关键帧无缝衔接,增强视频连贯性和叙事性。它在视频生成领域具有重要应用价值,尤其在需要精确控制视频内容的场景中表现出色。