Leffa

1年前发布 17 0 0

Leffa是一个用于可控人物图像生成的统一框架，它能够精确控制人物的外观（例如虚拟试穿）和姿态（例如姿态转移）。该模型通过在训练期间引导目标查询关注参考图像中的相应区域，减少细节扭曲，同时保持高图像质量。Leffa的主要优点包括模型无关性，可以用于提升其他扩散模型的性能。

收录时间：

2025-05-30

打开网站手机查看

图像生成 # 图像生成 # 姿态转移 # 扩散模型 # 模型无关性 # 虚拟试穿

Leffa

Leffa

Leffa是一个用于可控人物图像生成的统一框架，它能够精确控制人物的外观（例如虚拟试穿）和姿态（例如姿态转移）。该模型通过在训练期间引导目标查询关注参考图像中的相应区域，减少细节扭曲，同时保持高图像质量。Leffa的主要优点包括模型无关性，可以用于提升其他扩散模型的性能。

数据统计

相关导航

Dreamer

将稳定扩散集成到Notion中，使用新的削减命令AI生成图像。

Diffusion Self-Distillatio

Diffusion Self-Distillation是一种基于扩散模型的自蒸馏技术，用于零样本定制图像生成。该技术允许艺术家和用户在没有大量配对数据的情况下，通过预训练的文本到图像的模型生成自己的数据集，进而微调模型以实现文本和图像条件的图像到图像任务。这种方法在保持身份生成任务的性能上超越了现有的零样本方法，并能与每个实例的调优技术相媲美，无需测试时优化。

NanoBananaAPI.ai

Nano Banana API 提供 AI 图像生成与编辑接口，支持自然语言编辑、角色一致性保障、多图合成等功能。其主要优点在于高效稳定的性能、逼真写实效果和多图合成创意构图。

Frames

Frames是Runway Research推出的最新图像生成基础模型，它在风格控制和视觉保真度方面迈出了一大步。该模型擅长保持风格一致性，同时允许广泛的创意探索，能够为项目建立特定的外观，并可靠地生成忠实于您美学的变化。Frames的推出标志着在创意工作流程中，用户可以构建更多属于自己的世界，实现更大、更无缝的创意流程。

AI Banana Image Generator

AI Banana 是一款先进的图像编辑平台，利用 Nano Banana AI 技术，通过自然语言处理实现 1-2 秒内的图像生成与编辑。该产品适合各种创意需求，包括电子商务、市场营销和设计等领域。价格灵活，提供按需购买和订阅服务，满足不同用户的需求。

ColorFlow

ColorFlow是一个为图像序列着色而设计的模型，特别注重在着色过程中保留角色和对象的身份信息。该模型利用上下文信息，能够根据参考图像池为黑白图像序列中的不同元素（如角色的头发和服装）准确生成颜色，并确保与参考图像的颜色一致性。ColorFlow通过三个阶段的扩散模型框架，提出了一种新颖的检索增强着色流程，无需每个身份的微调或显式身份嵌入提取，即可实现具有相关颜色参考的图像着色。ColorFlow的主要优点包括其在保留身份信息的同时，还能提供高质量的着色效果，这对于卡通或漫画系列的着色具有重要的市场价值。

Qwen2vl-Flux

Qwen2vl-Flux是一个结合了Qwen2VL视觉语言理解能力的FLUX框架的先进多模态图像生成模型。该模型擅长基于文本提示和视觉参考生成高质量图像，提供卓越的多模态理解和控制。产品背景信息显示，Qwen2vl-Flux集成了Qwen2VL的视觉语言能力，增强了FLUX的图像生成精度和上下文感知能力。其主要优点包括增强的视觉语言理解、多种生成模式、结构控制、灵活的注意力机制和高分辨率输出。

Xno.ai

探索19个顶尖的文本到图像AI，使用39个GPU。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...