🗨️ Kokoro Web - Open WebUI的轻松TTS

warning

本教程是社区贡献，不受Open WebUI团队支持。它仅作为如何为您的特定用例自定义Open WebUI的演示。想要贡献？请查看贡献教程。

什么是`Kokoro Web`？

Kokoro Web为强大的Kokoro-82M文本转语音模型提供轻量级、OpenAI兼容的API，与Open WebUI无缝集成，通过自然声音增强您的AI对话。

🚀 两步集成

1. 部署Kokoro Web API（一个命令）

services:
  kokoro-web:
    image: ghcr.io/eduardolat/kokoro-web:latest
    ports:
      - "3000:3000"
    environment:
      # 将此更改为任何秘密密钥，用作您的OpenAI兼容API密钥
      - KW_SECRET_API_KEY=your-api-key
    volumes:
      - ./kokoro-cache:/kokoro/cache
    restart: unless-stopped

运行命令：docker compose up -d

2. 连接OpenWebUI（30秒）

在OpenWebUI中，转到管理面板 → 设置 → 音频
配置：
- 文本转语音引擎：OpenAI
- API基础URL：http://localhost:3000/api/v1
  （如果使用Docker：http://host.docker.internal:3000/api/v1）
- API密钥：your-api-key（来自步骤1）
- TTS模型：model_q8f16（大小/质量的最佳平衡）
- TTS语音：af_heart（默认温暖、自然的英语语音）。您可以将其更改为来自Kokoro Web演示的任何其他语音或公式

就是这样！您的OpenWebUI现在具有AI语音功能。

🌍 支持的语言

Kokoro Web支持8种语言，每种语言都有专门优化的语音：

英语（美国）- en-us
英语（英国）- en-gb
日语 - ja
中文 - cmn
西班牙语 - es-419
印地语 - hi
意大利语 - it
葡萄牙语（巴西）- pt-br

每种语言都有专用语音，可实现最佳发音和自然流畅性。请参见GitHub仓库获取完整的特定语言语音列表，或使用Kokoro Web演示即时预览和创建您自己的自定义语音。

💾 适用于任何硬件的优化模型

选择适合您硬件需求的模型：

模型ID	优化	大小	适用于
model_q8f16	混合精度	86 MB	推荐 - 最佳平衡
model_quantized	8位	92.4 MB	良好的CPU性能
model_uint8f16	混合精度	114 MB	中端CPU上更好的质量
model_q4f16	4位和fp16权重	154 MB	更高质量，仍然高效
model_fp16	fp16	163 MB	高级质量
model_uint8	8位和混合	177 MB	平衡选项
model_q4	4位矩阵乘法	305 MB	高质量选项
model	fp32	326 MB	最高质量（较慢）

✨ 安装前试用

访问Kokoro Web演示即时预览所有语音。此演示：

100%在您的浏览器中运行 - 无需服务器
永久免费 - 无使用限制或注册需要
零安装 - 只需访问网站即可开始创建
包含所有功能 - 立即测试任何语音或语言

需要更多帮助？

有关其他选项、语音自定义指南和高级设置，请访问GitHub仓库。

在您的OpenWebUI对话中享受自然的AI语音！

什么是Kokoro Web？​

🚀 两步集成​

1. 部署Kokoro Web API（一个命令）​

2. 连接OpenWebUI（30秒）​

🌍 支持的语言​

💾 适用于任何硬件的优化模型​

✨ 安装前试用​

需要更多帮助？​