Skip to main content

🗨️ 配置

Open Web UI支持本地、浏览器和远程语音转文本。

alt text

alt text

云/远程语音转文本提供商

目前支持以下云语音转文本提供商。API密钥可以配置为环境变量(OpenAI)或在管理设置页面中配置(两种密钥)。

服务需要API密钥
OpenAI
DeepGram

WebAPI通过内置的浏览器STT提供商提供STT。

配置您的STT提供商

要配置语音转文本提供商:

  • 导航到管理设置
  • 选择音频
  • 提供API密钥并从下拉菜单中选择模型

alt text

用户级设置

除了管理面板中提供的实例设置外,还有一些用户级设置可以提供额外功能。

  • STT设置: 包含与语音转文本功能相关的设置。
  • 语音转文本引擎: 确定用于语音识别的引擎(默认或Web API)。

alt text

使用STT

语音转文本提供了一种使用语音"编写"提示的高效方式,在桌面和移动设备上都能稳健运行。

要使用STT,只需点击麦克风图标:

alt text

实时音频波形将指示成功的语音捕获:

alt text

STT模式操作

录音开始后,您可以:

  • 点击勾选图标保存录音(如果启用完成后自动发送,将发送完成;否则您可以手动发送)
  • 如果您希望中止录音(例如,您希望开始新录音),可以点击'x'图标退出录音界面

alt text