设置 TTS
方案概述
语音合成(TTS)有多种可选方案,当前首选 Edge TTS(微软在线引擎,免费)。
方案对比
| 方案 | 费用 | 中文质量 | 音色 | 中英混合 | 部署难度 | 当前状态 |
|---|---|---|---|---|---|---|
| Edge TTS | 免费 | ⭐⭐⭐ | 较单一/机械 | ✅ | HA 插件,简单 | ✅ 首选 |
| 阿里云 TTS | 有免费额度,后续收费 | ⭐⭐⭐⭐⭐ | 丰富/有情感 | ✅ | HA 插件,简单 | 备选 |
| OpenAI 兼容 TTS | 按量付费/本地免费 | ⭐⭐⭐⭐ | 取决于模型 | ✅ | 中等 | 备选 |
| Kokoro | 本地免费 | ⭐⭐(中文差) | 一般 | ❌ | 本地部署 | 已排除 |
| Piper | 本地免费 | ⭐⭐ | 机械 | ❌ | 本地部署 | 已排除 |
各方案详解
Edge TTS(首选)
- HA 插件:Edge TTS 集成,安装即用
- 引擎:微软在线 TTS
- 优势:完全免费、HA 集成成熟
- 劣势:音色较单一和机械,可以继续探索其他音色
- 结论:免费方案中的最佳选择
阿里云 TTS(备选)
- HA 插件:阿里云 TTS 集成
- 优势:音色丰富、有情感表现力
- 劣势:有免费额度但后续收费
- 适用场景:对语音品质要求高时启用
OpenAI 兼容 TTS(备选)
-
实现:通过 HA 的 OpenAI 兼容 TTS 插件
-
后端可选:
- 硅基流动(SiliconFlow)的语音模型
- Kokoro(本地部署,需 GPU 加速)
-
优势:灵活切换后端,GPU 本地加速可行
已排除方案
Piper
- 本地运行较慢
- 处理大模型输出的特殊字符和表情时容易崩溃
Kokoro(本地)
- 英文输出不错,中文输出较差
- 中英文结合效果不佳
未来方向
如果有较好的 GPU,可以探索部署本地 TTS 模型以获得更好的中英文混合效果。