概述
OpenClaw v2026.5.4 大幅增强了 Google Meet 集成:
- 实时 Gemini 语音桥:低延迟语音
- 节奏化音频流:避免抖动
- 背压感知缓冲:网络自适应
- 打断队列清理:支持自然打断
- 支持Twilio 拨入:通过电话号码加入
让 OpenClaw Agent 可以真正参与会议,不只是后台监听。
前置要求
- OpenClaw v2026.5.4 或更高版本
- Google Workspace 账户
- Gemini API Key(实时语音)
- Twilio 账户(电话场景)
配置 Google Meet
基础启用
# config.yaml
channels:
google-meet:
enabled: true
auth:
method: "oauth"
clientId: "$GOOGLE_CLIENT_ID"
clientSecret: "$GOOGLE_CLIENT_SECRET"
OAuth 授权
openclaw auth login --provider google-meet
会打开浏览器请求 Google Workspace 权限。
实时语音桥
启用 Gemini 实时语音
channels:
google-meet:
enabled: true
voiceBridge:
provider: "gemini-realtime"
apiKey: "$GOOGLE_API_KEY"
model: "gemini-3.1-realtime"
audio:
pacedStreaming: true
backpressureAware: true
bargeInClearing: true
noTwiMLFallback: true
音频配置详解
Paced Streaming
避免音频"卡顿"或"流水账":
audio:
pacedStreaming:
enabled: true
targetLatencyMs: 200
bufferMs: 50
Backpressure-Aware
网络变化时自适应:
- 网络好:高质量
- 网络差:自动降级
- 极差:缓冲等待
Barge-in Clearing
支持自然打断:
用户:那么关于 X 问题...
Agent(开始回答):
用户(突然打断):等等,先不说这个
Agent:[立即停止],[切换到新话题]
类人体验。
Twilio 拨入
让 Agent 可以接电话:
channels:
google-meet:
twilio:
enabled: true
accountSid: "$TWILIO_SID"
authToken: "$TWILIO_TOKEN"
phoneNumber: "+1234567890"
voiceBridge:
provider: "gemini-realtime"
应用场景
- 远程会议拨入
- 客户电话接听
- 多方电话会议 AI 助手
加入会议
邀请 Agent
用户:让 AI 助手加入下午 3 点的产品会议
Meet 会议链接:https://meet.google.com/abc-defg-hij
Agent:好的,我会在 3 点加入会议
Agent 配置
agents:
meeting-assistant:
provider: "anthropic"
model: "claude-opus-4-7"
persona:
name: "Anna"
voice:
provider: "gemini-realtime"
voice: "Aoede"
skills:
- meeting-transcribe
- summary-generator
- action-extractor
standingOrders: |
在会议中:
1. 默认安静聆听
2. 被点名时简洁回答
3. 会议结束后生成纪要
会议中的能力
1. 实时转写
自动转写所有发言:
agents:
meeting-assistant:
onMessage:
- action: transcribe
- action: identifySpeaker
- action: saveToHistory
2. 实时回答
被点名时回答问题:
张三:@Anna 我们 Q2 的销售数据是多少?
Anna(Agent):[查询 CRM] Q2 销售额 $X 美元,
比 Q1 增长 Y%,主要驱动力是...
3. 自动总结
会议结束自动生成:
- 纪要:关键讨论点
- 决策:达成的结论
- 行动项:todo 和负责人
- 未解决:需要后续跟进
agents:
meeting-assistant:
onMeetingEnd:
- generateSummary
- extractActionItems
- sendToParticipants
4. 行动项追踪
会议结束后:
Anna:本次会议产生 5 个行动项:
1. 张三:完成 Q3 预算(5/10 前)
2. 李四:联系供应商 ABC(5/8 前)
3. 王五:准备客户演示(5/15 前)
4. 团队:审查产品 PRD(5/12 前)
5. 张三:跟进 X 项目(5/20 前)
我已自动创建到 Linear,会跟踪进度。
多语言会议
自动语言识别
agents:
meeting-assistant:
language:
autoDetect: true
supported: ["zh", "en", "ja", "ko"]
实时翻译
[英文发言]
John: Let's discuss Q2 revenue.
[Anna 提供中文翻译,仅给中文用户看]
中文用户屏幕:John: 让我们讨论 Q2 收入。
双语主持
agents:
bilingual-host:
persona:
languages:
- "中文"
- "English"
behavior:
autoTranslate: true
summaryInBoth: true
隐私和合规
录音同意
会议开始时通知:
Anna:本次会议有 AI 助手参与,
将进行实时转写和总结。
如有异议请告知。
数据驻留
channels:
google-meet:
dataResidency:
region: "asia-east"
retention: "30d" # 30 天后删除
敏感信息屏蔽
agents:
meeting-assistant:
redact:
enabled: true
patterns:
- creditCard
- ssn
- apiKey
性能优化
网络优化
audio:
network:
preferredRegions:
- "asia-east1"
- "asia-southeast1"
fallback:
enabled: true
资源管理
agents:
meeting-assistant:
resources:
maxConcurrentMeetings: 5
gpuOptimized: true
实际应用场景
场景 1:销售跟进
agents:
sales-assistant:
skills:
- meeting-transcribe
- crm-update
- email-draft
workflow:
onMeetingEnd:
- extractKeyPoints
- updateCRM
- draftFollowupEmail
场景 2:技术评审
agents:
tech-reviewer:
persona:
name: "Code Bot"
skills:
- code-analysis
- architecture-review
- github-tools
behavior:
activeMode: "on-mention"
contributeWhen:
- code-review-discussion
- architecture-questions
场景 3:客户电话
channels:
twilio:
enabled: true
phoneNumbers:
- "+1-800-CUSTOMER"
agents:
phone-cs:
persona:
voice:
provider: "gemini-realtime"
style: "warm"
skills:
- customer-lookup
- order-management
- issue-tracking
故障排查
加入会议失败
openclaw doctor channel google-meet
检查:
- OAuth token 有效性
- 会议链接格式
- 网络连接
音频问题
- 音频卡顿 → 检查网络、调整 paced streaming
- 听不清 → 检查麦克风权限
- Agent 不回答 → 检查触发关键词
转写不准确
- 检查语言设置
- 提高音质
- 配置专业术语词典
注意事项
- Google Meet 增强需要 OpenClaw v2026.5.4 或更高版本
- 实时语音桥消耗较多 API 配额
- Twilio 拨入产生通话费
- 录音务必合规,遵守当地法律
- 敏感会议建议本地处理
- 多人会议性能注意(建议 ≤ 10 人)
- 中国用户访问 Google 服务需要稳定国际网络
- 国内类似场景考虑钉钉、飞书会议
- 测试网络环境,会议中切换会很尴尬