百聆

1年前发布 16 0 0

百聆是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,提供高质量的语音对话体验。其主要优点是无需GPU即可实现类GPT-4o的对话效果,适用于各种边缘设备和低资源环境。百聆完全开源,鼓励社区贡献与二次开发,用户可以根据自己的需求...

收录时间:
2025-05-30

百聆是一个开源语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,提供高质量的语音对话体验。其主要优点是无需GPU即可实现类GPT-4o的对话效果,适用于各种边缘设备和低资源环境。百聆完全开源,鼓励社区贡献与二次开发,用户可以根据自己的需求进行定制和优化。

数据统计

相关导航

PodcastWorld

PodcastWorld

PodcastWorld是一个利用人工智能技术,通过分析数百万播客对话来帮助用户找到所需答案的搜索引擎。用户可以询问问题,并直接收听播客中回答该问题的确切片段。这个平台不仅提供了一个与播客内容互动的新方式,还通过聊天功能,使用户能够与播客创作者进行更深入的交流。PodcastWorld通过提供播客摘要、音频片段和完整的对话记录,满足了用户对信息获取和知识分享的需求。
Gemini Pro Chatbot

Gemini Pro Chatbot

Gemini Pro Chatbot 是一款基于 Google Gemini Pro AI 模型开发的移动聊天应用。它通过 React Native 和 Expo 构建,支持实时流式响应、代码高亮、消息持久化存储等功能。该应用允许用户通过自定义系统提示词和创建不同个性的 AI 代理来优化聊天体验。其主要优点包括强大的语言理解能力、灵活的定制化选项以及跨平台支持,适合希望高效利用 AI 进行对话和内容创作的用户。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...