Qwen2.5-Coder-0.5B

11个月前发布 9 0 0

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,显著提升了编码能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,编码能力与GPT-4o相当。此外,Qwen2...

收录时间:
2025-06-02
Qwen2.5-Coder-0.5BQwen2.5-Coder-0.5B

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成代码推理代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,显著提升了编码能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,编码能力与GPT-4o相当。此外,Qwen2.5-Coder还为实际应用如代码代理提供了更全面的基础,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。

数据统计

相关导航

Qwen2.5-Coder-0.5B-Instruct-AWQ

Qwen2.5-Coder-0.5B-Instruct-AWQ

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于Qwen2.5的强大能力,通过扩展训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此模型为AWQ量化的4位指令调整0.5B参数版本,具有因果语言模型、预训练和后训练、transformers架构等特点。
Qwen2.5-Coder-32B-Instruct

Qwen2.5-Coder-32B-Instruct

Qwen2.5-Coder是一系列专为代码生成设计的Qwen大型语言模型,包含0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B是目前最先进的开源代码生成大型语言模型,其编码能力与GPT-4o相匹配。它不仅增强了编码能力,还保持了在数学和通用能力方面的优势,并支持长达128K令牌的长上下文。
DeepSeek-Manim-Animation-Generator

DeepSeek-Manim-Animation-Generator

DeepSeek-Manim-Animation-Generator是一个结合了DeepSeek语言模型和Manim动画引擎的工具。它允许用户通过简单的文本指令生成复杂的数学和科学动画。该工具的主要优点是能够将复杂的科学概念转化为直观的动画,极大地简化了动画制作流程。DeepSeek的API提供了强大的语言理解能力,而Manim则负责将这些概念转化为高质量的视觉内容。该工具主要面向教育工作者、学生以及任何需要将科学概念可视化的专业人士。它不仅提高了动画制作的效率,还降低了技术门槛,使得更多人能够轻松创建动画。
poolside

poolside

poolside是一个为软件工程挑战而构建的先进基础AI模型,它通过在用户代码上进行微调,学习项目的独特之处,以理解通用模型无法理解的复杂性。它建立在poolside基础之上,每天都能变得更好。除了先进的代码编写模型,poolside还构建了一个直观的编辑器助手,并提供了一个开发者可以构建的API。poolside由Jason Warner和Eiso Kant于2023年4月创立,他们之前在AI和软件工程领域有着丰富的经验。
NovaSky

NovaSky

NovaSky 是一个专注于提升代码生成和推理模型性能的人工智能技术平台。它通过创新的测试时扩展技术(如 S*)、强化学习蒸馏推理等技术,显著提升了非推理模型的性能,使其在代码生成领域表现出色。该平台致力于为开发者提供高效、低成本的模型训练和优化解决方案,帮助他们在编程任务中实现更高的效率和准确性。NovaSky 的技术背景源于 Sky Computing Lab @ Berkeley,具有强大的学术支持和前沿的技术研究基础。目前,NovaSky 提供多种模型优化方法,包括但不限于推理成本优化和模型蒸馏技术,满足不同开发者的需求。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...