On-device Sora

1年前发布 19 0 0

On-device Sora 是一个开源项目，旨在通过线性比例跳跃（LPL）、时间维度标记合并（TDTM）和动态加载并发推理（CI-DL）等技术，实现在移动设备（如 iPhone 15 Pro）上高效的视频生成。该项目基于 Open-Sora 模型开发，能够根据文本输入生成高质量视频。其主要优点包括高效性、低功耗和对移动设备的优化。该技术...

收录时间：

2025-05-30

打开网站手机查看

视频创作 # AI # 开源 # 扩散模型 # 移动设备 # 视频生成

On-device Sora

On-device Sora

On-device Sora 是一个开源项目，旨在通过线性比例跳跃（LPL）、时间维度标记合并（TDTM）和动态加载并发推理（CI-DL）等技术，实现在移动设备（如 iPhone 15 Pro）上高效的视频生成。该项目基于 Open-Sora 模型开发，能够根据文本输入生成高质量视频。其主要优点包括高效性、低功耗和对移动设备的优化。该技术适用于需要在移动设备上快速生成视频内容的场景，如短视频创作、广告制作等。项目目前开源，用户可以免费使用。

数据统计

相关导航

Lloyd

Lloyd是一款结合了人工智能视觉识别技术的应用，它能够通过视频捕捉来解锁知识、洞察和信息，帮助用户在任何时间、任何地点增强视频通讯体验。Lloyd的主要优点在于其实时视觉AI能力，使得用户可以即刻学习和发现新事物。此外，Lloyd还提供了快速的视频通讯服务，结合了文本和语音消息的便捷性以及视频聊天的直观性。

MM_StoryAgent

MM_StoryAgent 是一个基于多智能体范式的故事视频生成框架，它结合了文本、图像和音频等多种模态，通过多阶段流程生成高质量的故事视频。该框架的核心优势在于其可定制性，用户可以自定义专家工具以提升每个组件的生成质量。此外，它还提供了故事主题列表和评估标准，便于进一步的故事创作和评估。MM_StoryAgent 主要面向需要高效生成故事视频的创作者和企业，其开源特性使得用户可以根据自身需求进行扩展和优化。

Jellypod 2.0

Jellypod 2.0 是一款全新的 AI 播客创作平台，旨在提供更高的创作自由度和灵活性。它不仅支持音频播客，还能生成视频内容，帮助用户提升播客的视觉效果和受众参与度。通过强大的 AI 技术，Jellypod 2.0 让用户无需设计技能即可创建专业的封面艺术，同时支持多语言播出和一键发布到多个平台。该产品适合各种类型的播客创作者，提供丰富的创作工具和发布选项，帮助他们更快地成长和吸引听众。

Veo 5 AI

Veo 5 AI视频生成器是一款基于Veo 5技术的下一代AI视频生成器，能够快速创建出令人惊叹的超逼真视频。它采用最新的Veo 5 A模型，实现智能场景理解、自然运动合成和上下文感知渲染，带来前所未有的超逼真和创造力。

长上下文调优（LCT）

长上下文调优（LCT）旨在解决当前单次生成能力与现实叙事视频制作之间的差距。该技术通过数据驱动的方法直接学习场景级一致性，支持交互式多镜头开发和合成生成，适用于视频制作的各个方面。

ReCapture

ReCapture是一种从单一用户提供的视频生成新视频和新颖摄像机轨迹的方法。该技术允许我们从完全不同的角度重新生成源视频，并带有电影级别的摄像机运动。ReCapture通过使用多视图扩散模型或基于深度的点云渲染生成带有新摄像机轨迹的嘈杂锚视频，然后通过我们提出的掩蔽视频微调技术将锚视频重新生成为干净且时间上一致的重新角度视频。这种技术的重要性在于它能够利用视频模型的强大先验，将近似的视频重新生成为时间上一致且美观的视频。

MemenomeLM

MemenomeLM是一个创新的在线教育工具，通过将PDF文档转化为视频内容，帮助用户更高效地学习。它利用先进的AI技术，将枯燥的文字转化为生动的视频，使学习变得更加有趣和高效。产品主要面向学生群体，尤其是那些需要处理大量阅读材料的学生。它提供了多种视频格式和声音效果，以满足不同用户的需求。MemenomeLM有免费版和付费版，付费版提供更多功能，如更多的视频生成次数、高级AI声音和专属服务器等。

Seedance Pro

Seedance Pro是一款专业AI视频生成平台，利用先进的AI技术创建高质量视频内容。其主要优点包括平滑稳定的动作生成、多镜头故事叙事、多样化的风格表达、准确的提示跟踪等。定位于创意视频制作领域。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...