VideoTetris VideoTetris是一个新颖的框架,它实现了文本到视频的生成,特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术,精确地遵循复杂的文本语义,并通过操作和组合去噪网络的空间和时间注意力图来实现。此外,它还引入了一种新的参考帧注意力机制,以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。
Follow-Your-Pose Follow-Your-Pose是一个文本到视频生成的模型,它利用姿势信息和文本描述来生成可编辑、可控制姿势的角色视频。这项技术在数字人物创作领域具有重要应用价值,解决了缺乏综合数据集和视频生成先验模型的限制。通过两阶段训练方案,结合预训练的文本到图像模型,实现了姿势可控的视频生成。
Buildots Buildots是一款基于人工智能的施工进度跟踪工具,通过准确测量工地表现,可有效减少延迟时间,提高施工效率。产品背景源于建筑行业对于精准施工管理的需求,定位于提供高效的施工管理解决方案。
拓世智能 拓世智能是一家领先的人工智能技术研发和应用企业,拥有多项自主知识产权的生物识别技术,包括人脸识别、虹膜识别、静脉识别等。其中,拓世AI数字人是一种运用人工智能技术制作的虚拟人物,能够以同样真实的形象进行实时互动和服务。
MyGPT by SamurAI ChatGPT插件是一种特殊工具,帮助ChatGPT扩展其搜索、计算和使用第三方服务的能力,包括代码解释器、谷歌搜索、Wolfram Alpha、Klarna购物、Milo Family AI、Shop、Zapier和Speak。