Azure Speech
语音合成 AI 模型与路由安装命令
npx clawhub@latest install azure-speech
安装说明
1
确认环境
确保已安装 Node.js 22+ 和 OpenClaw。在终端运行 openclaw --version 确认 OpenClaw 正常工作。
2
执行安装
在终端中运行上方安装命令,ClawHub 会自动下载并安装 Azure Speech 到 ~/.openclaw/skills/ 目录。
3
验证安装
运行 openclaw skills list 查看已安装技能列表,确认 Azure Speech 已出现在列表中。
4
配置参数(可选)
根据下方介绍中的配置说明,在 ~/.config/openclaw/openclaw.json5 中添加技能的配置项。
手动安装方式:将 Skill 文件夹复制到
~/.openclaw/skills/ 或项目目录下的 skills/ 文件夹,确保文件夹中包含 SKILL.md 文件。
100+ 语言
神经网络声音
自定义声音
情感表达
STT/TTS 双向
详细介绍
Azure Speech 是 Microsoft 的企业级语音服务,与 OpenClaw v2026.4.25 原生集成。
核心功能
- 100+ 语言:覆盖全球主要语言
- 神经网络声音:自然流畅
- 自定义声音:基于样本克隆个人/品牌声音
- 情感表达:开心、难过、严肃等多种风格
- STT 和 TTS:语音识别和合成都支持
- PCM 电话格式:适配呼叫中心
安装命令
clawhub install azure-speech
配置示例
providers:
azure-speech:
apiKey: "$AZURE_SPEECH_KEY"
region: "eastus"
defaultVoice: "zh-CN-XiaoxiaoNeural"
中文声音推荐
zh-CN-XiaoxiaoNeural(晓晓):女声,温柔zh-CN-YunyangNeural(云阳):男声,沉稳zh-CN-XiaohanNeural(晓涵):女声,活泼zh-CN-YunfengNeural(云枫):男声,专业
使用场景
- 企业客服:多语言客户支持
- 国际化产品:多语言版本一键支持
- 辅助工具:无障碍朗读
- 内容制作:自动生成配音
- 电话机器人:PCM 格式适配
自定义声音
Azure Speech 支持声音克隆:
- 提供 5-30 分钟样本
- 训练专属声音模型
- 商业品牌声音
注意事项
- 需要 Microsoft Azure 账户
- 国内访问可能需要选择就近 Region
- 自定义声音需要单独申请权限
- 商业使用注意 Azure 条款
- 与 ElevenLabs 相比价格更友好但情感表达略弱