谷歌藏私货,Gemma 4 最强版竟在安卓,提取模型碾压Unsloth
昨晚Reddit上有个帖子火了,说谷歌在安卓系统里藏了个宝——一个比网上所有版本都聪明的Gemma 4 e4b模型。
- 用户从Google AI Edge Gallery提取的litertlm格式模型只有3.6G,比Unsloth的量化版还小。
- 这个安卓提取版表现更聪明,比网上下的各种版本都好用。
- 社区版(litert-community/gemma-4-E4B-it-litert-lm)却bug频出,连俄语都写不通顺。
Reddit网友的深夜发现
事情是这样的,有个用户半夜睡不着,捣鼓安卓手机上的Google AI Edge Gallery。他用adb工具把里面的Gemma 4 e4b模型给提取出来了,格式是litertlm。一上手就觉得不对劲,这模型怎么反应这么快,逻辑也比他从Hugging Face或者别的地方下载的版本要清晰?
“Why does Gemma 4 e4b from Google AI Edge Gallery on Android weigh only 3.6 gigs, while the one from Unsloth (gemma-4-E4B-it-UD-Q2_K_XL.gguf) weighs 3.7, and for some reason the model image in litertlm format extracted via adb from Google AI Edge Gallery on Android acts smarter than all the versions I’ve downloaded from the internet and tried…”
更离谱的是,他对比了社区维护的litertlm版本(litert-community/gemma-4-E4B-it-litert-lm),结果那个版本用俄语生成的内容完全没法看。这差距也太明显了,让人不得不怀疑,谷歌是不是把优化过的好东西只放在自家应用里了。
谷歌的“私货”和开源社区的无奈

这事说白了,就是个典型的“官方特供”和“社区分发”的差别。谷歌在安卓Gallery里放的,很可能是针对移动端深度优化过的版本,体积控制得更好,推理效率也更高。而开源社区从原始权重转换、量化出来的版本,比如Unsloth的GGUF量化版,或者litert-community转换的litertlm版,中间经过的环节多,保不齐哪个步骤就引入了问题。
那篇帖子的最后,楼主自己也迷糊了,问大家是不是他搞错了,还是熬夜熬出幻觉了。但评论区里已经有人开始讨论怎么批量提取这个“官方优化版”了。这场景,是不是有点像当年某些游戏主机独占内容被破解出来的感觉?
这事对我们普通用户有什么影响?讲真,影响不大,但挺有意思。它提醒我们,大厂开源模型是一回事,但他们在自己生态里部署的版本,可能才是“完全体”。以后看评测,可能得区分是“官方部署版”还是“社区转换版”了。对于爱折腾的开发者来说,这可能又多了一条找优质模型的野路子——去官方应用里“挖矿”。
留言聊聊
你觉得谷歌这么做是技术优化还是有意区分?你会去尝试提取这个安卓里的“隐藏版”吗?
来源:Reddit LocalLLaMA|原文:Did Google hide the best version of Gemma 4 e4b in Android? The extracted model beats Unsloth and everything else I’ve tried.
夜雨聆风