Skip to main content

🗨️ Kokoro Web - Open WebUI的轻松TTS

warning

本教程是社区贡献,不受Open WebUI团队支持。它仅作为如何为您的特定用例自定义Open WebUI的演示。想要贡献?请查看贡献教程。

什么是Kokoro Web

Kokoro Web为强大的Kokoro-82M文本转语音模型提供轻量级、OpenAI兼容的API,与Open WebUI无缝集成,通过自然声音增强您的AI对话。

🚀 两步集成

1. 部署Kokoro Web API(一个命令)

services:
kokoro-web:
image: ghcr.io/eduardolat/kokoro-web:latest
ports:
- "3000:3000"
environment:
# 将此更改为任何秘密密钥,用作您的OpenAI兼容API密钥
- KW_SECRET_API_KEY=your-api-key
volumes:
- ./kokoro-cache:/kokoro/cache
restart: unless-stopped

运行命令:docker compose up -d

2. 连接OpenWebUI(30秒)

  1. 在OpenWebUI中,转到管理面板设置音频
  2. 配置:
    • 文本转语音引擎:OpenAI
    • API基础URL:http://localhost:3000/api/v1
      (如果使用Docker:http://host.docker.internal:3000/api/v1
    • API密钥:your-api-key(来自步骤1)
    • TTS模型:model_q8f16(大小/质量的最佳平衡)
    • TTS语音:af_heart(默认温暖、自然的英语语音)。您可以将其更改为来自Kokoro Web演示的任何其他语音或公式

就是这样!您的OpenWebUI现在具有AI语音功能。

🌍 支持的语言

Kokoro Web支持8种语言,每种语言都有专门优化的语音:

  • 英语(美国)- en-us
  • 英语(英国)- en-gb
  • 日语 - ja
  • 中文 - cmn
  • 西班牙语 - es-419
  • 印地语 - hi
  • 意大利语 - it
  • 葡萄牙语(巴西)- pt-br

每种语言都有专用语音,可实现最佳发音和自然流畅性。请参见GitHub仓库获取完整的特定语言语音列表,或使用Kokoro Web演示即时预览和创建您自己的自定义语音。

💾 适用于任何硬件的优化模型

选择适合您硬件需求的模型:

模型ID优化大小适用于
model_q8f16混合精度86 MB推荐 - 最佳平衡
model_quantized8位92.4 MB良好的CPU性能
model_uint8f16混合精度114 MB中端CPU上更好的质量
model_q4f164位和fp16权重154 MB更高质量,仍然高效
model_fp16fp16163 MB高级质量
model_uint88位和混合177 MB平衡选项
model_q44位矩阵乘法305 MB高质量选项
modelfp32326 MB最高质量(较慢)

✨ 安装前试用

访问Kokoro Web演示即时预览所有语音。此演示:

  • 100%在您的浏览器中运行 - 无需服务器
  • 永久免费 - 无使用限制或注册需要
  • 零安装 - 只需访问网站即可开始创建
  • 包含所有功能 - 立即测试任何语音或语言

需要更多帮助?

有关其他选项、语音自定义指南和高级设置,请访问GitHub仓库

在您的OpenWebUI对话中享受自然的AI语音!