TwelveLabs

1年前发布 18 0 0

TwelveLabs是一个强大的视频智能平台，通过能够看、听、推理的人工智能，发现深度见解，分析、重组和自动化工作流程。它可以看到视频背后的整个故事，是视频智能的未来。

收录时间：

2025-06-02

打开网站手机查看

视频创作 # 人工智能 # 大数据 # 食品

TwelveLabs

TwelveLabs

TwelveLabs是一个强大的视频智能平台，通过能够看、听、推理的人工智能，发现深度见解，分析、重组和自动化工作流程。它可以看到视频背后的整个故事，是视频智能的未来。

数据统计

相关导航

OmniHuman-1

OmniHuman-1 是一个端到端的多模态条件人类视频生成框架，能够基于单张人像和运动信号（如音频、视频或其组合）生成人类视频。该技术通过混合训练策略克服了高质量数据稀缺的问题，支持任意宽高比的图像输入，生成逼真的人类视频。它在弱信号输入（尤其是音频）方面表现出色，适用于多种场景，如虚拟主播、视频制作等。

Seedance Pro

Seedance Pro是一款专业AI视频生成平台，利用先进的AI技术创建高质量视频内容。其主要优点包括平滑稳定的动作生成、多镜头故事叙事、多样化的风格表达、准确的提示跟踪等。定位于创意视频制作领域。

JustLearn app

JustLearn是一个教育性质的滚动应用，旨在用快速、有趣且共享的学习机会替代我们在社交媒体上的无效时间消耗。开发者通过观察到许多人在社交媒体上浪费大量时间，决定创建一个平台，让人们在短短5分钟内学到新知识，就像刷TikTok一样轻松有趣。JustLearn提供选择话题、浏览验证过的视频、回答问题、进行测验和参加由顶尖教授制作的迷你课程等功能，让用户在短时间内学到超过90%的人一天所学。产品背景是创造一个让学习变得吸引人、快速且社区化的平台。

TANGO Model

TANGO是一个基于层次化音频-运动嵌入和扩散插值的共语手势视频重现技术。它利用先进的人工智能算法，将语音信号转换成相应的手势动作，实现视频中人物手势的自然重现。这项技术在视频制作、虚拟现实、增强现实等领域具有广泛的应用前景，能够提升视频内容的互动性和真实感。TANGO由东京大学和CyberAgent AI Lab联合开发，代表了当前人工智能在手势识别和动作生成领域的前沿水平。

Wan2.1-FLF2V-14B

Wan2.1-FLF2V-14B 是一个开源的大规模视频生成模型，旨在推动视频生成领域的进步。该模型在多项基准测试中表现优异，支持消费者级 GPU，能够高效生成 480P 和 720P 的视频。它在文本到视频、图像到视频等多个任务中表现出色，具有强大的视觉文本生成能力，适用于各种实际应用场景。

swiftnotes.ai

Swiftnotes.ai 是一款专注于提升学习效率的工具，它利用AI技术将YouTube视频内容快速转换为结构化的笔记。这种技术能够帮助用户节省大量的手动笔记时间，同时通过内嵌的引用链接，用户可以快速跳转到视频的关键部分。该产品的定位是为学生、研究人员和知识工作者提供高效的学习解决方案，目前暂未明确其是否收费，但其高效、便捷的特性使其在教育领域具有重要价值。

Seedance AI Video Generator

Seedance AI是一款强大的文生视频模型，能从简单的文本提示词生成高质量、具有叙事性的视频。具有动态镜头运动、1080p高清视频输出等特点，为用户提供了创作电影级视频的便利。

Apollo-LMMs

Apollo是一个专注于视频理解的先进大型多模态模型家族。它通过系统性地探索视频-LMMs的设计空间，揭示了驱动性能的关键因素，提供了优化模型性能的实用见解。Apollo通过发现'Scaling Consistency'，使得在较小模型和数据集上的设计决策能够可靠地转移到更大的模型上，大幅降低计算成本。Apollo的主要优点包括高效的设计决策、优化的训练计划和数据混合，以及一个新型的基准测试ApolloBench，用于高效评估。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...