xiaozhi-esp32

11个月前发布 11 0 0

xiaozhi-esp32 是一个开源的 AI 聊天机器人项目,基于乐鑫的 ESP-IDF 开发。它将大语言模型与硬件设备相结合,使用户能够打造出个性化的 AI 伴侣。项目支持多种语言的语音识别与对话,具备声纹识别功能,能够识别不同用户的语音特征。其开源特性降低了 AI 硬件开发的门槛,为学生、开发者等群体提供了宝贵的学习资源,有助于推动...

收录时间:
2025-05-29
xiaozhi-esp32xiaozhi-esp32

xiaozhi-esp32 是一个开源AI 聊天机器人项目,基于乐鑫的 ESP-IDF 开发。它将大语言模型与硬件设备相结合,使用户能够打造出个性化的 AI 伴侣。项目支持多种语言的语音识别与对话,具备声纹识别功能,能够识别不同用户的语音特征。其开源特性降低了 AI 硬件开发的门槛,为学生、开发者等群体提供了宝贵的学习资源,有助于推动 AI 技术在硬件领域的应用与创新。项目目前免费开源,适合不同层次的开发者进行学习与二次开发。

数据统计

相关导航

Phi-4-multimodal-instruct

Phi-4-multimodal-instruct

Phi-4-multimodal-instruct 是微软开发的多模态基础模型,支持文本、图像和音频输入,生成文本输出。该模型基于Phi-3.5和Phi-4.0的研究和数据集构建,经过监督微调、直接偏好优化和人类反馈强化学习等过程,以提高指令遵循能力和安全性。它支持多种语言的文本、图像和音频输入,具有128K的上下文长度,适用于多种多模态任务,如语音识别、语音翻译、视觉问答等。该模型在多模态能力上取得了显著提升,尤其在语音和视觉任务上表现出色。它为开发者提供了强大的多模态处理能力,可用于构建各种多模态应用。
SmolVLM-500M-Instruct

SmolVLM-500M-Instruct

SmolVLM-500M 是由 Hugging Face 开发的轻量级多模态模型,属于 SmolVLM 系列。该模型基于 Idefics3 架构,专注于高效的图像和文本处理任务。它能够接受任意顺序的图像和文本输入,生成文本输出,适用于图像描述、视觉问答等任务。其轻量级架构使其能够在资源受限的设备上运行,同时保持强大的多模态任务性能。该模型采用 Apache 2.0 许可证,支持开源和灵活的使用场景。
Pickle

Pickle

Pickle是一个创新的在线服务,它允许用户创建一个逼真的AI克隆人,这个克隆人可以实时唇形同步用户的语音,并在视频会议中代替用户出现。这项技术的重要性在于,它提供了一种新的远程工作和在线交流的方式,尤其对于那些不方便露面、需要移动性或需要休息的用户来说,Pickle可以让他们保持在会议中的存在感。产品背景信息显示,Pickle由Pickle, Inc.开发,位于美国加利福尼亚州旧金山。关于价格和定位,页面上没有提供具体信息,可能需要进一步联系客服了解。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...