Translation Agent Translation Agent 是一个使用反思工作流的机器翻译演示项目。它由 Andrew Ng 以及合作者开发,主要利用大型语言模型(LLM)进行文本翻译,并反思翻译结果以提出改进建议。该模型的可定制性高,可以调整翻译风格、处理习语和专有名词,以及针对特定地区或方言进行优化。尽管目前该软件还不够成熟,但已经显示出与传统机器翻译系统相比有时更具竞争力的潜力。
Image/Manga Translator 该项目可以将漫画/图片中的文字进行翻译,主要功能包括文本检测、光学字符识别(OCR)、机器翻译和图像修补。它支持多种语言如日语、中文、英语和韩语等,可实现近乎完美的翻译效果。该项目主要面向漫画爱好者和图像处理工作者,可以方便地阅读外语漫画或进行图像的多语言处理。此外,它还提供Web服务、在线演示和命令行工具等多种使用方式,具有良好的可用性。该项目代码开源,欢迎大家一起完善和贡献。
Chiao AI Chiao AI是一款AI文档翻译工具,为用户提供专业的文档翻译服务。Chiao AI提供PDF、Word、Excel、PPT等文档的高质量AI翻译服务,支持176种语言、50+文件格式。告别低质量机翻!Chiao AI让文档翻译像聊天一样简单,大文件翻译,边聊边改就搞定。免费10MB,专业版50MB,格式完美还原!
Microsoft Azure Video Translation API Microsoft Azure Video Translation API 是一项基于云的视频翻译服务,它利用人工智能技术自动翻译视频内容并生成配音。这项服务支持多种语言,可以帮助企业轻松本地化视频内容,以满足全球不同受众的需求。它通过提供自动化的解决方案来克服语言障碍,提高内容的全球可访问性。视频翻译API支持批量处理,允许用户上传视频文件,自动提取对话音频,进行翻译,并生成同步的字幕和配音。此外,它还提供了内容编辑功能,允许用户在最终确定配音视频之前审查和编辑翻译内容,确保准确度和文化适当性。
Pipio | Video Dubbing 该产品通过AI技术实现视频语音的自动配音和口型同步,可以轻松实现视频的多语种翻译,并保留原始音色。主要特点包括:1)33%以上的同步精度,媲美人工口型同步;2)无损视频分辨率;3)高保真语音翻译。面向的群体包括:企业培训部门、销售人员、营销团队和内容创作者。提供免费入门版和付费专业版,欢迎体验。
StreamSpeech StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略,有效识别流式语音输入中的翻译时机,实现高质量的实时通信体验。该模型在CVSS基准测试中取得了领先的性能,并能提供低延迟的中间结果,如ASR或翻译结果。
StreamV2V StreamV2V是一个扩散模型,它通过用户提示实现了实时的视频到视频(V2V)翻译。与传统的批处理方法不同,StreamV2V采用流式处理方式,能够处理无限帧的视频。它的核心是维护一个特征库,该库存储了过去帧的信息。对于新进来的帧,StreamV2V通过扩展自注意力和直接特征融合技术,将相似的过去特征直接融合到输出中。特征库通过合并存储的和新的特征不断更新,保持紧凑且信息丰富。StreamV2V以其适应性和效率脱颖而出,无需微调即可与图像扩散模型无缝集成。
Dubtitles DubTitles是一个使用AI技术生成多语言字幕的工具。它可以将任何语言的YouTube视频转换为英文字幕,支持超过50种语言。使用我们的工具,您可以轻松生成准确、上下文相关的字幕,并提升视频的搜索引擎可见性。定价方面,每个学分对应一分钟的视频,例如10个学分可以生成10分钟视频的字幕。