Evan
发布于 2026-06-02 / 2 阅读
0
0

设置TTS

设置 TTS

方案概述

语音合成(TTS)有多种可选方案,当前首选 Edge TTS(微软在线引擎,免费)。

方案对比

方案 费用 中文质量 音色 中英混合 部署难度 当前状态
Edge TTS 免费 ⭐⭐⭐ 较单一/机械 HA 插件,简单 ✅ 首选
阿里云 TTS 有免费额度,后续收费 ⭐⭐⭐⭐⭐ 丰富/有情感 HA 插件,简单 备选
OpenAI 兼容 TTS 按量付费/本地免费 ⭐⭐⭐⭐ 取决于模型 中等 备选
Kokoro 本地免费 ⭐⭐(中文差) 一般 本地部署 已排除
Piper 本地免费 ⭐⭐ 机械 本地部署 已排除

各方案详解

Edge TTS(首选)

  • HA 插件:Edge TTS 集成,安装即用
  • 引擎:微软在线 TTS
  • 优势:完全免费、HA 集成成熟
  • 劣势:音色较单一和机械,可以继续探索其他音色
  • 结论:免费方案中的最佳选择

阿里云 TTS(备选)

  • HA 插件:阿里云 TTS 集成
  • 优势:音色丰富、有情感表现力
  • 劣势:有免费额度但后续收费
  • 适用场景:对语音品质要求高时启用

OpenAI 兼容 TTS(备选)

  • 实现:通过 HA 的 OpenAI 兼容 TTS 插件

  • 后端可选

    • 硅基流动(SiliconFlow)的语音模型
    • Kokoro(本地部署,需 GPU 加速)
  • 优势:灵活切换后端,GPU 本地加速可行

已排除方案

Piper

  • 本地运行较慢
  • 处理大模型输出的特殊字符和表情时容易崩溃

Kokoro(本地)

  • 英文输出不错,中文输出较差
  • 中英文结合效果不佳

未来方向

如果有较好的 GPU,可以探索部署本地 TTS 模型以获得更好的中英文混合效果。


评论