Skip to content

wangz-code/legado-edge-tts

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

49 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

legado-edge-tts

edge 大声朗读微软 TTS 服务, 在阅读 APP 中添加配置语音引擎方式收听微软 TTS / Edge 大声朗读 也可以在浏览器直接访问自动下载的.mp3 文件流

其他说明

- EdgeSpeakFetch.kt 是基于[edge-tts](https://github.com/rany2/edge-tts) 通过gpt提取核心逻辑生成的, 可直接在阅读内部集成
- 理论上和rany2/edge-tts 参数都一致, 一荣俱荣一损俱损 EdgeVersion=140.0.3485.14
- 如果没有VPS部署可以使用 https://github.com/wangz-code/legado-tts 阅读内部集成了Edge大声朗读和豆包

方式一 直接运行,需要 python 环境

# 如果发现接口不能使用 把 edgetts请升级到最新版: pip install -U edge-tts
pip install aiohttp edge-tts requests openai
python main.py

# 在阅读内语速最好设置为2.5     >2.5 就读的快, < 2.5 就读的慢
# 阅读内朗读引擎配置url
http://127.0.0.1:1233/api/rap,{"method": "POST", "body": "text={{encodeURIComponent(speakText)}}&rate={{speakSpeed}}&voice=zh-CN-XiaoxiaoNeural"}

增加小米 MimoTTS, 还有几天可以白嫖,后续就要收费了 导入方式同Edge,参数相同,voice 和 style 略有不同

# 需要自己注册api-key 填写在开头
http://127.0.0.1:1233/api/mimo,{"method": "POST", "body": "text={{encodeURIComponent(speakText)}}&rate={{speakSpeed}}&voice=Chloe&style=一位年迈的老先生,说带北方口音的普通话,语速缓慢而沉稳,嗓音略带沙哑和沧桑感"}
# 流式响应
http://127.0.0.1:1233/api/mimostream,{"method": "POST", "body": "text={{encodeURIComponent(speakText)}}&rate={{speakSpeed}}&voice=苏打&style=一本正经地, 压低嗓音像在密谋"}

# curl 测试
curl -X POST http://localhost:1233/api/mimo \
  -F "text=这么多年过去了,再走过那条街,心里一下子空了一块。!" \
  -F "voice=Chloe" \
  -F "style=一位年迈的老先生,说带北方口音的普通话,语速缓慢而沉稳,嗓音略带沙哑和沧桑感" \
  -F "rate=30" \
  --output result.wav
音色名 Voice ID 语言 性别
MiMo-默认 mimo_default 因部署集群而异,中国集群默认为冰糖,其他集群默认为Mia
冰糖 冰糖 中文 女性
茉莉 茉莉 中文 女性
苏打 苏打 中文 男性
白桦 白桦 中文 男性
Mia Mia 英文 女性
Chloe Chloe 英文 女性
Milo Milo 英文 男性
Dean Dean 英文 男性

style

── 日常对话 ──────────────────────────────────────────────

  • "温暖朋友": "温柔且真诚的语气,像老朋友聊天一样自然亲切,语速适中,偶尔带点笑意",
  • "元气少女": "活泼俏皮,语调上扬,充满朝气和感染力,像在和闺蜜分享开心的事",
  • "高冷御姐": "慵懒而从容,语调平稳不急不缓,带有淡淡的疏离感和自信",
  • "沉稳大叔": "醇厚低沉的嗓音,语速偏慢,沉稳有力,像深夜电台主播娓娓道来",

── 专业播报 ──────────────────────────────────────────────

  • "新闻主播": "严肃干练的播音腔,字正腔圆,语速稳定,权威而有公信力",
  • "纪录片旁白": "深沉而富有磁性的嗓音,语调舒缓沉稳,带有一种探寻和叙述的庄重感",
  • "睡前故事": "极尽温柔的低语,语速非常缓慢,声音轻柔如耳语,营造安宁放松的氛围",

── 角色演绎 ──────────────────────────────────────────────

  • "撒娇少女": "夹子音,软糯甜腻,尾音故意拉长上扬,带点委屈和依赖感",
  • "东北老铁": "东北话,豪爽直接,大嗓门,语气热情奔放,自带喜感",
  • "川味辣妹": "四川话,泼辣爽快,语速偏快,语气中带着不服输的劲头",
  • "粤语大佬": "粤语,低沉霸气,语速不紧不慢,每个字都带着压迫感和掌控感",

── 情感表达 ──────────────────────────────────────────────

  • "深情告白": "动情而克制的语气,声音微微发颤,语速偏慢,饱含真挚和小心翼翼",
  • "热血燃向": "兴奋激昂,语速逐渐加快,声音饱满有力,像在为一场胜利呐喊",
  • "孤独独白": "平静而略带忧伤,语速缓慢,尾音微微下沉,像一个人在深夜自言自语",
  • "毒舌吐槽": "冷漠中带着嘲讽,语调平平但句尾略微上扬,阴阳怪气但不失幽默",

── 内容创作 ──────────────────────────────────────────────

  • "有声书": "叙述感强,根据情节自然切换情绪,整体沉稳大气,有画面感",
  • "知识科普": "亲切而有条理,像一位有趣的老师在讲课,重点处会放慢加重",
  • "广告推销": "热情洋溢,充满感染力,语调起伏明显,让人忍不住想听下去",
  • "游戏解说": "兴奋紧张交替,语速随局势变化,高潮处激昂爆发,低谷处压低声音制造悬念",

APP添加朗读引擎 📢注意点击页面的"+"号添加 祝大家玩的开心!

detail.png

/rap + /ra 其他可选参数

参数 默认值
voice zh-CN-XiaoxiaoNeural

常用音色

语音模型 性别 适用场景 风格特点
zh-CN-XiaoxiaoNeural Female 新闻、小说 温和
zh-CN-XiaoyiNeural Female 动漫、小说 活泼
zh-CN-YunjianNeural Male 体育、小说 激昂
zh-CN-YunxiNeural Male 小说 活泼、阳光
zh-CN-YunxiaNeural Male 动漫、小说 可爱
zh-CN-YunyangNeural Male 新闻 专业、可靠
zh-CN-liaoning-XiaobeiNeural Female 方言 幽默
zh-CN-shaanxi-XiaoniNeural Female 方言 明快

/rap2 其他可选参数

参数 默认值 描述
voice zh-CN-XiaoxiaoNeural 旁白音色
voice_chat zh-CN-YunxiNeural 对话音色
volume_chat 0 对话音量

方式二 使用 pm2 运行, 需要 node 环境

# 如果没有node 需要先安装node, 推荐使用nvm  https://github.com/nvm-sh/nvm
node -v
# 安装pm2 至全局
npm install pm2 -g
# 运行,负载均衡, 进程守护:PM2 可以始终保持应用程序运行。当应用程序崩溃时,PM2 可以自动重启它,确保服务的可用性。
pm2 start "python3 main.py"

curl -X POST http://localhost:1233/api/rapmimo
-F "text=老板,你猜怎么着?我通过了!"
-F "voice=Chloe"
-F "style=明亮、活泼、略带欢快的语调"
-F "rate=30"
--output result.wav

基于

https://github.com/rany2/edge-tts

https://github.com/callmerio/doubao-tts

About

edge大声朗读微软TTS服务, 在阅读legado中配置语音引擎方式收听微软TTS / Edge大声朗读, 如果没有 vps 部署可以看看内置 TTS https://github.com/wangz-code/ddo-tts

Topics

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors