首页 资讯 下载 教程 Skills 社群

OpenAI Whisper

语音 AI 模型与路由

安装命令

npx clawhub@latest install openai-whisper

安装说明

1
确认环境

确保已安装 Node.js 22+ 和 OpenClaw。在终端运行 openclaw --version 确认 OpenClaw 正常工作。

2
执行安装

在终端中运行上方安装命令,ClawHub 会自动下载并安装 OpenAI Whisper 到 ~/.openclaw/skills/ 目录。

3
验证安装

运行 openclaw skills list 查看已安装技能列表,确认 OpenAI Whisper 已出现在列表中。

4
配置参数(可选)

根据下方介绍中的配置说明,在 ~/.config/openclaw/openclaw.json5 中添加技能的配置项。

手动安装方式:将 Skill 文件夹复制到 ~/.openclaw/skills/ 或项目目录下的 skills/ 文件夹,确保文件夹中包含 SKILL.md 文件。
本地识别 多语言 离线运行

详细介绍

OpenAI Whisper 技能集成了 Whisper 语音识别模型的本地 CLI 版本,实现完全离线的语音转文字功能,支持多种语言。

核心功能

  • 本地运行:完全离线,数据不上传至云端
  • 多语言支持:支持 99 种语言的语音识别
  • 多格式输入:支持 MP3、WAV、M4A、FLAC 等音频格式
  • 时间戳:可输出带时间戳的逐句转录

安装

clawhub install openai-whisper

配置参数

{
  skills: {
    "openai-whisper": {
      model: "base",            // 模型大小:tiny | base | small | medium | large
      language: "zh",           // 默认识别语言
      timestamps: true,         // 是否输出时间戳
      outputFormat: "text"      // 输出格式:text | srt | vtt | json
    }
  }
}

使用提示

  • tiny 模型最快但精度较低,large 最精确但需更多显存
  • 中文识别推荐使用 medium 以上模型
  • 首次使用会自动下载模型文件