推荐 3 个火火火的 AI 语音开源项目 !

程序IT圈

共 1716字,需浏览 4分钟

 ·

2024-06-20 12:10

嗨喽!GitHub科技的各位小伙伴们,由于公众号做了乱序推送改版,为了保证公众号的推文能够第一时间及时送达到大家手上,大家记得将公众号 加星标置顶 ,公众号每天会送上几个GitHub开源项目给大家学习 !


1

   

视频翻译配音

这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。
语音识别支持 faster-whisper模型 openai-whisper模型 和 GoogleSpeech zh_recogn阿里中文语音识别模型 。
文字翻译支持 微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|离线翻译OTT 。

https://github.com/jianchang512/pyvideotrans


2

   

本地运行语音处理:Sherpa-ONNX

sherpa-ONNX 是一个开源项目,它允许您在本地设备上运行语音处理模型,包括语音识别、语音合成、说话人识别和语音活动检测。它支持多种平台和操作系统,包括 Windows、macOS、Linux、Android 和 iOS,以及多种编程语言,例如 C++、Python、Java 和 C#。

https://github.com/k2-fsa/sherpa-onnx

3

   

ChatTTS语音克隆

ChatTTS是一款神奇工具,能让你的文字像人一样说话,而且听起来自然真实。这个工具适合用在需要语音合成的场景,比如智能助手、客服机器人,甚至是让你的文章或故事开口说话。
ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。
亮点:
  • 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。

  • 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。

  • 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。

https://github.com/2noise/ChatTTS

   
--完--

读到这里说明你喜欢本公众号的文章,欢迎 置顶(标星)本公众号 GitHub科技,这样就可以第一时间获取推送了~


本公众号,后台回复:666,领取一份450个副业指南手册 !

1. 推荐 3 个 yyds 开源的后端管理系统 !
2. 盘点 3 个惊艳的 GitHub 开源项目 !
3. 推荐 3 个 yyds 的 开源项目 !
4. 推荐 3 个火火火的 GitHub 开源项目 !


觉得内容还不错的话,给我点个“在看”呗





浏览 28
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报