EXAONE-3.5-2.4B-Instruct

1年前发布 17 0 0

EXAONE-3.5-2.4B-Instruct是LG AI Research开发的一系列双语（英语和韩语）指令调优的生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的通用领域中保持竞争力。该模型特别适合需要处理长文本和...

收录时间：

2025-05-29

打开网站手机查看

文案写作 # conversational # custom_code # exaone # lg-ai # Safetensors # Transformers # 文本生成 # 汉语 # 英语

EXAONE-3.5-2.4B-Instruct

EXAONE-3.5-2.4B-Instruct

EXAONE-3.5-2.4B-Instruct是LG AI Research开发的一系列双语（英语和韩语）指令调优的生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的通用领域中保持竞争力。该模型特别适合需要处理长文本和多语言需求的场景，如自动翻译、文本摘要、对话系统等。

数据统计

相关导航

Winihelper

Winihelper是一款由大学生团队开发的AI工具集，旨在通过先进的multi-agent系统架构和自研技术，优化工作流程，释放个人的全部潜能。产品依托北京绘感科技有限公司的万亿级专业数据库，提供高质量论文和专业百科词条，以专业写手的语气定制算法生成文本，让AI成为超级打工人。

Llama-3-Patronus-Lynx-8B-Instruct

Llama-3-Patronus-Lynx-8B-Instruct是由Patronus AI开发的一个基于meta-llama/Meta-Llama-3-8B-Instruct模型的微调版本，主要用于检测在RAG设置中的幻觉。该模型训练于包含CovidQA、PubmedQA、DROP、RAGTruth等多个数据集，包含人工标注和合成数据。它能够评估给定文档、问题和答案是否忠实于文档内容，不提供文档之外的新信息，也不与文档信息相矛盾。

aya-101

Aya模型是一个大规模的多语言生成性语言模型，能够在101种语言中遵循指令。该模型在多种自动和人类评估中优于mT0和BLOOMZ，尽管它覆盖的语言数量是后者的两倍。Aya模型使用包括xP3x、Aya数据集、Aya集合、DataProvenance集合的一个子集和ShareGPT-Command等多个数据集进行训练，并在Apache-2.0许可下发布，以推动多语言技术的发展。

WorldPM-72B

WorldPM-72B 是一个通过大规模训练获得的统一偏好建模模型，具有显著的通用性和较强的表现能力。该模型基于 15M 偏好数据，展示了在客观知识的偏好识别方面的巨大潜力。适合用于生成更高质量的文本内容，尤其在写作领域具有重要的应用价值。

ultravox-v0_4_1-llama-3_1-70b

fixie-ai/ultravox-v0_4_1-llama-3_1-70b是一个基于预训练的Llama3.1-70B-Instruct和whisper-large-v3-turbo的大型语言模型，能够处理语音和文本输入，生成文本输出。该模型通过特殊伪标记<|audio|>将输入音频转换为嵌入，并与文本提示合并后生成输出文本。Ultravox的开发旨在扩展语音识别和文本生成的应用场景，如语音代理、语音到语音翻译和口语音频分析等。该模型遵循MIT许可，由Fixie.ai开发。

QwQ-32B-Preview

QwQ-32B-Preview是一个由Qwen团队开发的实验性研究模型，旨在提高人工智能的推理能力。该模型展示了有前景的分析能力，但也存在一些重要的限制。模型在数学和编程方面表现出色，但在常识推理和细微语言理解方面还有提升空间。该模型使用了transformers架构，具有32.5B个参数，64层，以及40个注意力头（GQA）。产品背景信息显示，QwQ-32B-Preview是基于Qwen2.5-32B模型的进一步开发，具有更深层次的语言理解和生成能力。

InternLM3

InternLM3 是由 InternLM 团队开发的一系列高性能语言模型，专注于文本生成任务。该模型通过多种量化技术优化，能够在不同硬件环境下高效运行，同时保持出色的生成质量。其主要优点包括高效的推理性能、多样化的应用场景以及对多种文本生成任务的优化支持。InternLM3 适用于需要高质量文本生成的开发者和研究人员，能够帮助他们在自然语言处理领域快速实现应用。

EXAONE-3.5-7.8B-Instruct-AWQ

EXAONE 3.5是LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的一般领域中保持竞争力。EXAONE 3.5模型包括：1) 2.4B模型，优化用于小型或资源受限设备的部署；2) 7.8B模型，与前代模型大小相匹配，但提供改进的性能；3) 32B模型，提供强大的性能。

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...