Stable Audio ControlNet
Stable Audio ControlNet 是一个基于 Stable Audio Open 的音乐生成模型,通过 DiT ControlNet 进行微调,能够在具有 16GB VRAM 的 GPU 上使用,支持音频控制。此模型仍在开发中,但已经能够实现音乐的生成和控制,具有重要的技术意义和应用前景。
musicgen-songstarter-v0.2是一个针对音乐制作人设计的音频生成模型,专门用于生成有用的旋律循环。该模型在Splice样本库中的旋律循环数据集上进行了微调,能够生成立体声音频,音频频率为32kHz。与v0.1版本相比,v0.2版本使用了三倍的独特样本,并且模型大小从中等提升到了大型。