Follow-Your-Pose

1年前发布 19 0 0

Follow-Your-Pose是一个文本到视频生成的模型，它利用姿势信息和文本描述来生成可编辑、可控制姿势的角色视频。这项技术在数字人物创作领域具有重要应用价值，解决了缺乏综合数据集和视频生成先验模型的限制。通过两阶段训练方案，结合预训练的文本到图像模型，实现了姿势可控的视频生成。

收录时间：

2025-05-30

打开网站手机查看

视频生成 # 人工智能 # 姿势引导 # 数字人物 # 文本到视频 # 视频生成

Follow-Your-Pose

Follow-Your-Pose

Follow-Your-Pose是一个文本到视频生成的模型，它利用姿势信息和文本描述来生成可编辑、可控制姿势的角色视频。这项技术在数字人物创作领域具有重要应用价值，解决了缺乏综合数据集和视频生成先验模型的限制。通过两阶段训练方案，结合预训练的文本到图像模型，实现了姿势可控的视频生成。

数据统计

相关导航

CopyCopter

CopyCopter是一款AI文本转视频工具，将长文本内容一键转换为生动的社交媒体视频，节省时间提高效率。

UniAnimate

UniAnimate是一个用于人物图像动画的统一视频扩散模型框架。它通过将参考图像、姿势指导和噪声视频映射到一个共同的特征空间，以减少优化难度并确保时间上的连贯性。UniAnimate能够处理长序列，支持随机噪声输入和首帧条件输入，显著提高了生成长期视频的能力。此外，它还探索了基于状态空间模型的替代时间建模架构，以替代原始的计算密集型时间Transformer。UniAnimate在定量和定性评估中都取得了优于现有最先进技术的合成结果，并且能够通过迭代使用首帧条件策略生成高度一致的一分钟视频。

VideoTetris

VideoTetris是一个新颖的框架，它实现了文本到视频的生成，特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术，精确地遵循复杂的文本语义，并通过操作和组合去噪网络的空间和时间注意力图来实现。此外，它还引入了一种新的参考帧注意力机制，以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。

CogiDigm

CogiDigm利用GenAI技术革新娱乐产业的叙事方式，包括电影制片厂、后期制作和广告代理公司。我们拥有尖端技术，成为行业领跑者。我们与FBRC.ai和AILA合作，提供视频生成和操作服务，释放创造力。我们的理念是采用以人为本的集体智能方法，提供广泛的服务，包括创新的GenAI解决方案、道德的AI模型实施、专业的技术指导、战略咨询和无缝部署专业知识。

Video-Infinity

Video-Infinity 是一种分布式长视频生成技术，能够在5分钟内生成2300帧的视频，速度是先前方法的100倍。该技术基于VideoCrafter2模型，采用了Clip Parallelism和Dual-scope Attention等创新技术，显著提高了视频生成的效率和质量。

Buildots

Buildots是一款基于人工智能的施工进度跟踪工具，通过准确测量工地表现，可有效减少延迟时间，提高施工效率。产品背景源于建筑行业对于精准施工管理的需求，定位于提供高效的施工管理解决方案。

Keeva AI

Keeva AI是一个多功能的AI数字人视频创作工具，专为海外中小企业和个人创作者提供视频创作解决方案。Keeva AI利用人工智能技术，能够智能生成和翻译视频脚本，并结合高质量的公共人像和模板，可以实现一键生成数字人营销视频的服务。用户只需输入视频主题，Keeva AI即可自动生成脚本并制作完整视频，同时支持上传自有脚本，选择数字人形象和语音生成视频。

CamCo

CamCo是一个创新的图像到视频生成框架，它能够生成具有3D一致性的高质量视频。该框架通过Plücker坐标引入相机信息，并提出了一种符合几何一致性的双线约束注意力模块。此外，CamCo在通过运动结构算法估计相机姿态的真实世界视频上进行了微调，以更好地合成物体运动。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...