OminiControl
OminiControl是一个为Diffusion Transformer模型如FLUX设计的最小但功能强大的通用控制框架。它支持主题驱动控制和空间控制(如边缘引导和图像修复生成)。OminiControl的设计非常精简,仅引入了基础模型0.1%的额外参数,同时保持了原始模型结构。这个项目由新加坡国立大学的学习与视觉实验室开发,代表了人工智能领域中图像生成和控制技术的最新进展。
Describe Anything 模型(DAM)能够处理图像或视频的特定区域,并生成详细描述。它的主要优点在于可以通过简单的标记(点、框、涂鸦或掩码)来生成高质量的本地化描述,极大地提升了计算机视觉领域的图像理解能力。该模型由 NVIDIA 和多所大学联合开发,适合用于研究、开发和实际应用中。