StreamSpeech

11个月前发布 11 0 0

StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略,有效识别流式语音输入中的翻译时机,实现高质量的实时通信体验。该模型在CVSS基准测试中取得了领先的性能,并能提供低延迟的中间结果,如ASR或翻译结果。

收录时间:
2025-05-29
StreamSpeechStreamSpeech

StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略,有效识别流式语音输入中的翻译时机,实现高质量的实时通信体验。该模型在CVSS基准测试中取得了领先的性能,并能提供低延迟的中间结果,如ASR或翻译结果。

数据统计

相关导航

ChatX翻译

ChatX翻译

ChatX是一款多语言实时翻译工具,致⼒为企业提供跨境翻译与私域营销的全⾯解决⽅案。ChatX翻译可以覆盖WhatsApp、Telegram、Facebook等海外主流平台,⽀持⼀站式多账号管理和⾼效便捷的粉丝运营。同时,ChatX内置的SCRM客户管理功能与AI技术深度融合,显著提升企业沟通效率,推动可持续增⻓。通过精准的跨境翻译与营销策略,帮助企业拓展更有价值的全球客户,实现⽆缝的出海全流程营销。
DuRT

DuRT

DuRT 是一款专注于 macOS 系统的语音识别和翻译工具。它通过本地 AI 模型和系统服务实现语音的实时识别与翻译,支持多种语音识别方法,提高了识别的准确度和语言支持范围。该产品以悬浮框形式展示结果,方便用户在使用过程中快速获取信息。其主要优点包括高准确度、隐私保护(不收集用户信息)以及便捷的操作体验。DuRT 定位为一款高效生产力工具,旨在帮助用户在多语言环境下更高效地进行沟通和工作。目前产品可在 Mac App Store 下载,具体价格未在页面中明确提及。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...