【重磅】Gemma 4 来了,实测手机和电脑上效果如何?

摘要：Google 深夜发布 Gemma 4，四种规格覆盖手机到工作站，Apache 2.0 完全开源，31B 性能直接干到全球开源第三。这波是真·降维打击。在第一时间在手机上和 19 年 mac 上进行了试用，在手机上运行的比电脑上还要流畅

01 / 四颗钻石，深夜突袭

北京时间 2026 年 4 月 3 日凌晨，Google 突然发布了新一代开源大模型 Gemma 4。

这次谷歌直接放出了四款不同规格的模型，覆盖了从端侧到云端的全场景：

最让人惊喜的是，这次 Gemma 4 全系采用 Apache 2.0 协议，彻底放开了商业使用限制。对比上一代 Gemma 3 的自定义协议，这一步跨得相当大。

💡 划重点：Apache 2.0 = 可商用、可修改、可再分发，几乎没有任何限制。

Gemma 4 最让人震惊的不是参数规模，而是 单位参数的智能水平。

在 Arena AI 排行榜上：

官方数据显示，Gemma 4 带来了这些提升：

这次谷歌重点照顾了端侧场景。Gemma 4 E2B/E4B被称为"最强手机端开源模型"。

根据社区评测，相比同尺寸其他模型，Gemma 4 在这些方面全面领先：

唯一短板是图像批量处理稍弱于 Qwen，但整体性价比已经拉满。对于想要做端侧 AI 应用的开发者来说，这基本是目前的最优解。

Gemma 4 的发布，其实再次印证了一个趋势：开源模型正在快速追赶闭源，而且小而精的路线越来越吃香。

31B 参数就能打到全球第三，干掉很多 400B 级别的模型，这本身就说明架构和训练数据的优化空间还很大。

对于开发者和创业者来说，这是好事：

💎 谷歌这波是直接把"单位参数性价比"拉到了一个新高度。接下来就看社区微调出多少神仙版本了。

手机选用的不是很高端的 K80，通过 Layla 进行安装，若是你喜欢折腾，也可以通过 termux 安装，更加极客一些，不过为了试用，简单点。

Layla 内置了高度优化的 llama.cpp内核，能够完美调用骁龙 8 Gen 3 的 CPU (Cortex-X4 超大核)
对于这个 APP，后面写个专门教程，敬请期待！

这个安装完成之后，也是可以直接点击下载模型，这个里面的是 4b，安装完成之后直接可以对话使用了，这里说下，我在飞行模式下进行的测试，可以看下效果。

MAC的配置是1.4 GHz 四核Intel Core i5加16G内存。通过 ollama运行，选取调教好的gemma-4-E4B-it运行

ollama run kwmcglon/gemma-4-E4B-it

通过 ollama 运行后，对下面截图进行分析，整体运行时长145.9 seconds，内存飙升上去，但是还是可以接受的，对于多模态的理解也是不错的。

结果如下：

而对于那些信息是需要联网的，他的回答，关注隐私的朋友，这个用起来是没有任何问题的

Gemma 4 不是那种参数堆到几千亿的"暴力美学"，而是靠架构优化把"每一块钱的性能"做到极致。 Apache 2.0 协议 + 多规格覆盖 + 惊艳性能，这波谷歌是真的想把开源市场做实。接下来几个月，应该会有一大波基于 Gemma 4 的应用冒出来。

你准备升级了吗？

👇 关注我，获取更多 AI 前沿干货