首页 资讯 下载 教程 Skills 社群

Azure Speech

语音合成 AI 模型与路由

安装命令

npx clawhub@latest install azure-speech

安装说明

1
确认环境

确保已安装 Node.js 22+ 和 OpenClaw。在终端运行 openclaw --version 确认 OpenClaw 正常工作。

2
执行安装

在终端中运行上方安装命令,ClawHub 会自动下载并安装 Azure Speech 到 ~/.openclaw/skills/ 目录。

3
验证安装

运行 openclaw skills list 查看已安装技能列表,确认 Azure Speech 已出现在列表中。

4
配置参数(可选)

根据下方介绍中的配置说明,在 ~/.config/openclaw/openclaw.json5 中添加技能的配置项。

手动安装方式:将 Skill 文件夹复制到 ~/.openclaw/skills/ 或项目目录下的 skills/ 文件夹,确保文件夹中包含 SKILL.md 文件。
100+ 语言 神经网络声音 自定义声音 情感表达 STT/TTS 双向

详细介绍

Azure Speech 是 Microsoft 的企业级语音服务,与 OpenClaw v2026.4.25 原生集成。

核心功能

  • 100+ 语言:覆盖全球主要语言
  • 神经网络声音:自然流畅
  • 自定义声音:基于样本克隆个人/品牌声音
  • 情感表达:开心、难过、严肃等多种风格
  • STT 和 TTS:语音识别和合成都支持
  • PCM 电话格式:适配呼叫中心

安装命令

clawhub install azure-speech

配置示例

providers:
  azure-speech:
    apiKey: "$AZURE_SPEECH_KEY"
    region: "eastus"
    defaultVoice: "zh-CN-XiaoxiaoNeural"

中文声音推荐

  • zh-CN-XiaoxiaoNeural(晓晓):女声,温柔
  • zh-CN-YunyangNeural(云阳):男声,沉稳
  • zh-CN-XiaohanNeural(晓涵):女声,活泼
  • zh-CN-YunfengNeural(云枫):男声,专业

使用场景

  • 企业客服:多语言客户支持
  • 国际化产品:多语言版本一键支持
  • 辅助工具:无障碍朗读
  • 内容制作:自动生成配音
  • 电话机器人:PCM 格式适配

自定义声音

Azure Speech 支持声音克隆:

  • 提供 5-30 分钟样本
  • 训练专属声音模型
  • 商业品牌声音

注意事项

  • 需要 Microsoft Azure 账户
  • 国内访问可能需要选择就近 Region
  • 自定义声音需要单独申请权限
  • 商业使用注意 Azure 条款
  • 与 ElevenLabs 相比价格更友好但情感表达略弱