DeepCoder

1年前发布 19 0 0

DeepCoder-14B-Preview 是一个基于强化学习的代码推理大型语言模型,能够处理长上下文,具有 60.6% 的通过率,适用于编程任务和自动化代码生成。该模型的优势在于其训练方法的创新,提供了比其他模型更优的性能,且完全开源,支持广泛的社区应用和研究。

收录时间:
2025-05-29
DeepCoderDeepCoder

DeepCoder-14B-Preview 是一个基于强化学习的代码推理大型语言模型,能够处理长上下文,具有 60.6% 的通过率,适用于编程任务和自动化代码生成。该模型的优势在于其训练方法的创新,提供了比其他模型更优的性能,且完全开源,支持广泛的社区应用和研究。

数据统计

相关导航

Atwork

Atwork

Atwork 是一款专注于提升团队工作效率的无代码工作操作系统。它通过灵活的数据管理、智能表格、自动化工作流等功能,帮助企业和团队简化复杂的业务流程,提高生产力。Atwork 的主要优点在于其高度的可定制性、无需编程技能即可快速搭建和调整工作流程,以及强大的协作功能。它适用于各种行业,无论是小型团队还是大型企业,都能通过 Atwork 实现高效的工作管理。Atwork 提供免费的基础版本,同时也有付费的高级功能,满足不同用户的需求。
GLM-Zero-Preview

GLM-Zero-Preview

GLM-Zero-Preview是智谱首个基于扩展强化学习技术训练的推理模型,专注于增强AI推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。与基座模型相比,在不显著降低通用任务能力的情况下,专家任务能力大幅提升。在AIME 2024、MATH500和LiveCodeBench评测中,效果与OpenAI o1-preview相当。产品背景信息显示,智谱华章科技有限公司致力于通过强化学习技术,提升模型的深度推理能力,未来将推出正式版GLM-Zero,扩展深度思考的能力到更多技术领域。
SWE-RL

SWE-RL

SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术,旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制,优化模型的推理能力,使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用,为软件工程领域带来了新的可能性。该技术目前处于研究阶段,尚未明确商业化定价,但其在提升开发效率和代码质量方面具有显著潜力。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...