OpenAI Whisper
语音 AI 模型与路由安装命令
npx clawhub@latest install openai-whisper
安装说明
1
确认环境
确保已安装 Node.js 22+ 和 OpenClaw。在终端运行 openclaw --version 确认 OpenClaw 正常工作。
2
执行安装
在终端中运行上方安装命令,ClawHub 会自动下载并安装 OpenAI Whisper 到 ~/.openclaw/skills/ 目录。
3
验证安装
运行 openclaw skills list 查看已安装技能列表,确认 OpenAI Whisper 已出现在列表中。
4
配置参数(可选)
根据下方介绍中的配置说明,在 ~/.config/openclaw/openclaw.json5 中添加技能的配置项。
手动安装方式:将 Skill 文件夹复制到
~/.openclaw/skills/ 或项目目录下的 skills/ 文件夹,确保文件夹中包含 SKILL.md 文件。
本地识别
多语言
离线运行
详细介绍
OpenAI Whisper 技能集成了 Whisper 语音识别模型的本地 CLI 版本,实现完全离线的语音转文字功能,支持多种语言。
核心功能
- 本地运行:完全离线,数据不上传至云端
- 多语言支持:支持 99 种语言的语音识别
- 多格式输入:支持 MP3、WAV、M4A、FLAC 等音频格式
- 时间戳:可输出带时间戳的逐句转录
安装
clawhub install openai-whisper
配置参数
{
skills: {
"openai-whisper": {
model: "base", // 模型大小:tiny | base | small | medium | large
language: "zh", // 默认识别语言
timestamps: true, // 是否输出时间戳
outputFormat: "text" // 输出格式:text | srt | vtt | json
}
}
}
使用提示
tiny模型最快但精度较低,large最精确但需更多显存- 中文识别推荐使用
medium以上模型 - 首次使用会自动下载模型文件