Qwen2.5-Coder-3B-Instruct-GPTQ-Int8

1年前发布 17 0 0

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8是Qwen2.5-Coder系列中的一种大型语言模型，专门针对代码生成、代码推理和代码修复进行了优化。该模型基于Qwen2.5，训练数据包括源代码、文本代码关联、合成数据等，达到5.5万亿个训练令牌。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模...

收录时间：

2025-05-29

打开网站手机查看

代码辅助 # GPTQ量化 # 代码修复 # 代码推理 # 代码生成 # 开源模型 # 长上下文

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8

Qwen2.5-Coder-3B-Instruct-GPTQ-Int8是Qwen2.5-Coder系列中的一种大型语言模型，专门针对代码生成、代码推理和代码修复进行了优化。该模型基于Qwen2.5，训练数据包括源代码、文本代码关联、合成数据等，达到5.5万亿个训练令牌。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。该模型还为现实世界中的应用提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

数据统计

相关导航

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-8B 是 DeepSeek 团队开发的高性能语言模型，基于 Llama 架构并经过强化学习和蒸馏优化。该模型在推理、代码生成和多语言任务中表现出色，是开源社区中首个通过纯强化学习提升推理能力的模型。它支持商业使用，允许修改和衍生作品，适合学术研究和企业应用。

Lune AI

Lune AI是一个社区驱动的专家级大型语言模型（LLMs）市场，由开发者在技术主题上创建，以超越单独的AI模型。它通过集成各种技术知识源，如GitHub仓库、文档等，减少技术查询的幻觉，并提供准确的参考。Lune AI的API与OpenAI兼容，可以轻松集成到各种支持OpenAI兼容模型的工具中，如Cursor、Continue等。此外，Lune AI还提供了一个付费计划，用户可以通过贡献和创建Lunes来获得报酬。

OpenAI Codex CLI

OpenAI Codex 是一个基于人工智能的编码助手，旨在提升开发者的工作效率。它能够理解自然语言指令并自动生成代码，适合需要高效编程和快速迭代的开发者。Codex 提供了交互式命令行界面，允许用户直接在终端中与其进行对话。该产品是免费使用的，定位于简化开发流程和提高代码质量。

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int8

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该系列模型通过增加训练令牌至5.5万亿，包括源代码、文本代码接地、合成数据等，显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，编码能力与GPT-4o相匹配。此外，Qwen2.5-Coder还为真实世界应用提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

AgileCoder

AgileCoder是一个创新的多智能体软件开发框架，灵感来源于专业软件工程中广泛使用的敏捷方法论。该框架的关键在于其任务导向的方法，而不是给智能体分配固定角色，AgileCoder通过创建任务积压和将开发过程划分为冲刺，模仿现实世界的软件开发，每个冲刺都会动态更新积压。AgileCoder支持多种模型，包括OpenAI、Azure OpenAI、Anthropic以及自托管的Ollama模型。

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B 是一个经过强化学习优化的推理模型，基于 Qwen-7B 进行了蒸馏优化。它在数学、代码和推理任务上表现出色，能够生成高质量的推理链和解决方案。该模型通过大规模强化学习和数据蒸馏技术，显著提升了推理能力和效率，适用于需要复杂推理和逻辑分析的场景。

Qwen2.5-Coder-14B-Instruct

Qwen2.5-Coder-14B-Instruct是Qwen2.5-Coder系列中的一个大型语言模型，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型通过扩展训练令牌到5.5万亿，包括源代码、文本代码接地、合成数据等，成为当前开源代码LLM的最新技术。它不仅增强了编码能力，还保持了在数学和通用能力方面的优势，并支持长达128K令牌的长上下文。

Qwen2.5-Coder-1.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型在训练中包含了5.5万亿的源代码、文本代码关联、合成数据等，是目前开源代码语言模型中的佼佼者，其编码能力可与GPT-4相媲美。此外，Qwen2.5-Coder还具备更全面的现实世界应用基础，如代码代理等，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...