自监督学习

共 5 篇网址

排序

发布更新浏览点赞

Sparsh

Sparsh是一系列通过自监督算法（如MAE、DINO和JEPA）训练的通用触觉表示。它能够为DIGIT、Gelsight'17和Gelsight Mini生成有用的表示，并在TacBench提出的下游任务中大幅度超越端到端模型，同时能够为新下游任务的数据高效训练提供支持。Sparsh项目包含PyTorch实现、预训练模型和与Sparsh一起发布的数据集。

0100

数据分析 # PyTorch # 数据集 # 机器学习

SHMT

SHMT是一种自监督的层次化化妆迁移技术，通过潜在扩散模型实现。该技术能够在不需要显式标注的情况下，将一种面部妆容自然地迁移到另一种面部上。其主要优点在于能够处理复杂的面部特征和表情变化，提供高质量的迁移效果。该技术在NeurIPS 2024上被接受，展示了其在图像处理领域的创新性和实用性。

0140

图像生成 # 化妆迁移 # 图像处理 # 潜在扩散模型

1.58-bit FLUX

1.58-bit FLUX是一种先进的文本到图像生成模型，通过使用1.58位权重（即{-1, 0, +1}中的值）来量化FLUX.1-dev模型，同时保持生成1024x1024图像的可比性能。该方法无需访问图像数据，完全依赖于FLUX.1-dev模型的自监督。此外，开发了一种定制的内核，优化了1.58位操作，实现了模型存储减少7.7倍，推理内存减少5.1倍，并改善了推理延迟。在GenEval和T2I Compbench基准测试中的广泛评估表明，1.58-bit FLUX在保持生成质量的同时显著提高了计算效率。

0140

图像生成 # 图像生成 # 模型优化 # 自监督学习

文鳐MaaS

文鳐MaaS是一个综合性的AI模型训练平台，它通过提供易操作的界面和强大的自监督学习能力，使用户能够根据自己的特定需求快速定制和部署AI模型。

0160

AI大模型平台 AI行业大模型 # AI模型定制 # AI行业大模型 # API接口调用

V-JEPA

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力。

0100

AIGC开发平台 AI开源项目 # AI开源项目 # Transformer模型 # V-JEPA