DeepSeek-R1-Distill-Llama-8B

11个月前发布 13 0 0

DeepSeek-R1-Distill-Llama-8B 是 DeepSeek 团队开发的高性能语言模型,基于 Llama 架构并经过强化学习和蒸馏优化。该模型在推理、代码生成和多语言任务中表现出色,是开源社区中首个通过纯强化学习提升推理能力的模型。它支持商业使用,允许修改和衍生作品,适合学术研究和企业应用。

收录时间:
2025-05-30
DeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-8B 是 DeepSeek 团队开发的高性能语言模型,基于 Llama 架构并经过强化学习和蒸馏优化。该模型在推理代码生成多语言任务中表现出色,是开源社区中首个通过纯强化学习提升推理能力的模型。它支持商业使用,允许修改和衍生作品,适合学术研究和企业应用。

数据统计

相关导航

Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Skywork-o1-Open-PRM-Qwen-2.5-1.5B是Skywork团队开发的一系列模型,这些模型结合了o1风格的慢思考和推理能力。该模型专门设计用于通过增量过程奖励增强推理能力,适合解决小规模的复杂问题。与简单的OpenAI o1模型复现不同,Skywork o1 Open系列模型不仅在输出中展现出固有的思考、规划和反思能力,而且在标准基准测试中的推理技能有显著提升。这一系列代表了AI能力的一次战略性进步,将原本较弱的基础模型推向了推理任务的最新技术(SOTA)。
Qwen2.5-Coder-3B-Instruct-GGUF

Qwen2.5-Coder-3B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。该模型在实际应用中提供了更全面的基础,如代码代理,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。
Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该模型在训练中涵盖了5.5万亿的源代码、文本代码基础、合成数据等,成为当前开源代码语言模型的最新技术。该模型不仅在编程能力上与GPT-4o相匹配,还在数学和一般能力上保持了优势。Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4模型是经过GPTQ量化的4位指令调整模型,具有因果语言模型、预训练和后训练、transformers架构等特点。
Agentless

Agentless

Agentless是一种无需代理的自动解决软件开发问题的方法。它通过定位、修复和补丁验证三个阶段来解决每个问题。Agentless利用分层过程定位故障到特定文件、相关类或函数,以及细粒度的编辑位置。然后,Agentless根据编辑位置采样多个候选补丁,并选择回归测试来运行,生成额外的复现测试以复现原始错误,并使用测试结果重新排名所有剩余补丁,以选择一个提交。Agentless是目前在SWE-bench lite上表现最佳的开源方法,具有82个修复(27.3%的解决率),平均每问题成本0.34美元。
Gemini Code Assist免费版

Gemini Code Assist免费版

Gemini Code Assist 是 Google 推出的一款免费 AI 编程助手,旨在帮助开发者更高效地编写和审查代码。它基于 Gemini 2.0 模型,支持所有公开领域的编程语言,并针对代码生成和审查进行了优化。该工具提供高达每月 180,000 次代码补全的免费使用额度,适合学生、自由开发者和初创团队等不同用户群体。通过集成到 Visual Studio Code 和 JetBrains IDEs 等开发环境中,开发者可以在不切换窗口的情况下完成代码生成、调试和修改。
Qwen2.5-Coder-14B

Qwen2.5-Coder-14B

Qwen2.5-Coder-14B是Qwen系列中专注于代码的大型语言模型,覆盖了0.5到32亿参数的不同模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此外,它还为现实世界应用如代码代理提供了更全面的基础,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。支持长达128K令牌的长上下文。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...