Google 发布开源模型 Gemma 4：256K 超长上下文、MoE 架构，开源模型性能新巅峰

Gemma 4 发布

2026 年 4 月 2 日，谷歌正式发布新一代开源大模型 Gemma 4，称其为迄今"最智能"的开源模型，主要面向高级推理和 AI Agent 工作流场景。

Gemma 4 基于与 Gemini 3 相同的研究和技术体系构建，采用 Apache 2.0 协议开源，商业使用限制较少。

版本	总参数	激活参数	上下文长度	架构
31B Dense	310 亿	310 亿	256K	全激活 Dense
26B A4B MoE	252 亿	38 亿	256K	混合专家
E4B	80 亿	45 亿	128K	混合专家
E2B	51 亿	23 亿	128K	混合专家

其中 E2B 和 E4B 是端侧模型，可以在手机上离线运行。

基于超过 140 种语言训练，具备多步规划和复杂逻辑推理能力。

谷歌与英伟达合作优化 Gemma 4 的 GPU 推理性能，特别是在 MoE 架构下的高效推理调度。

Gemma 4 的开源为 OpenClaw 提供了更多高质量的本地模型选择：