芯片拾荒者:AI时代的机顶盒战争
第一章 华强北的“垃圾”之王
深圳的雨季来得没头没脑,前一秒还闷热得像蒸笼,下一秒暴雨就砸在华强北的彩钢瓦棚顶上,发出炒豆子般的声响。
林晚蹲在柜台后面,手里捏着一把电烙铁,正小心翼翼地往一块巴掌大的主板上飞线。那是他从一台内屏粉碎的三星Z Flip5上拆下来的骁龙8 Gen 2主板——整机回收价才三百块,屏幕碎得连渣都不剩,但主板完好,甚至还能开机。
“林哥,我那台盒子散热又炸了,风扇狂转,游戏还是掉帧。”一个瘦高个年轻人趴在柜台外,把一台用透明亚克力壳子装着的设备推过来。
林晚头都没抬:“你换12V3A电源没?”
“换了啊,按你说的买了块12V3A,可还是热。”
“你用的是不是原装散热?那个3D打印的风道根本不行。”林晚放下烙铁,从柜台下面摸出一个铝合金硬盘盒,上面粘着一个14厘米的大风扇,“拿回去,把这个垫在盒子底下,风扇对着吹。风道设计成下吹上吸,既能给硬盘盒散热,又能给主板抽风。你要是再热,我把它吃了。”
瘦高个狐疑地接过风扇,又指了指柜台上另一台成品:“这台的飞鼠遥控器怎么卖?”
“整套650,不带硬盘。飞鼠是2.4G的,带全键盘,手感比那些十几块的强三条街。”林晚终于抬起头,露出那张略显苍白的脸,二十四岁,黑眼圈深得像被人揍了两拳。
他叫林晚,在华强北一个不起眼的角落租了三节柜台,主营“二手手机主板改装电视机顶盒”。这行当在垃圾佬圈子里有个更响亮的名字——“尸体复活术”。
第二章 人工智能的“降维打击”
2026年的春天,空气中弥漫着一种燥热。不是深圳的天气,而是资本对人工智能的狂热。
走在大街上,到处是“AI赋能”“大模型落地”的巨幅广告;打开手机,每个App都在问你“要不要试试我们的AI助手”。数据中心里,成千上万块H100显卡日夜不停地燃烧着电费,训练那些动辄千亿参数的巨型模型。
林晚对这些不太感冒。他只关心一件事:骁龙8 Gen 2的废屏主板还能不能再跌一跌。
直到那天下午,一个戴着黑框眼镜、背着瑞士军刀双肩包的中年男人站到了他柜台前。
“老板,你这盒子能跑AI模型吗?”
林晚一愣:“什么AI?”
“就是那种……”中年人比划着,“本地运行的,不联网的,能处理文档、能总结聊天记录的模型。我在网上看到有人用旧手机跑LLaMA,但都是技术宅自己折腾。我需要现成的,插上电就能用的。”
林晚来了点兴趣:“你说的是那种轻量级模型?参数多大的?”
“7B的,量化后大概4G左右。”中年人叫老赵,是一家小翻译公司的老板。他的业务涉及大量客户隐私文档,不敢用云端API,怕泄密。自己租服务器又不划算,听说有人用骁龙865就能跑小模型,就跑来华强北碰运气。
林晚翻出手机,查了查骁龙8 Gen 2跑LLaMA-7B的量化版——每秒大概能跑5-6个token,虽然不快,但应付文档摘要、翻译这种非实时任务足够了。
“能搞,但得加钱。”林晚说,“普通的机顶盒只要650,搞AI这个要加装散热、换大电源,还要刷我特制的系统,至少九百。”
老赵连价都没还:“我给你一千五,你帮我搞定。另外我想多买几台,公司几个合伙人每人一台。你们这小东西又便宜又隐蔽,不会被IT部门发现。”
林晚心里一惊:这他妈是个大单啊。
第三章 机顶盒AI化的技术噩梦
接下老赵的单子后,林晚才意识到自己给自己挖了多大的坑。
第一台样机他用的是手头现有的Z Flip5主板,骁龙8 Gen 2,12G内存。系统是基于LineageOS深度定制的,砍掉了所有Google服务,只留一个极简桌面。他花了一整天时间把llama.cpp编译进了安卓,又写了几个脚本,让机顶盒开机自动启动一个本地Web服务,同一WiFi下的电脑或手机就能通过浏览器访问AI功能。
但问题很快就暴露了。
首先是散热。跑AI模型时的功耗比玩模拟器还高,CPU和GPU几乎全程拉满,原来的风扇方案根本压不住。林晚翻遍了柜台下的零件箱,找出一块从服务器上拆下来的纯铜散热片,用电磨机切到刚好能覆盖骁龙芯片,再用导热胶粘上。然后在亚克力外壳上开了两个孔,装了一个小涡轮风扇,风道直吹铜片。
温度总算从85度降到了65度,勉强能接受。
第二个问题是供电。林晚发现当AI模型跑起来时,USB口的电压会出现波动,外接的机械硬盘偶尔会掉盘。他换上12V3A电源后好了不少,但还有个玄学问题:用无线飞鼠遥控器控制AI界面时,鼠标会飘。
他翻出之前的测试记录——12V2A的电源会导致无线信号被干扰,换了12V3A后干扰明显减少,但依然存在。林晚怀疑是USB3.0的电磁干扰,跑去电子市场花两块钱买了一包磁环,给所有连接线都夹上了。
鼠标飘移问题解决了八成,偶尔还是有一两下,但老赵应该不会在意。
第三个月,老赵带着三个合伙人来了。林晚给他们展示了样机:一台手掌大的亚克力盒子,插电自动开机,电视屏幕上显示一个极简的网页界面,上面只有一个对话框。
“你问它什么,它都能回答。模型离线运行,不上传任何数据。”
老赵用飞鼠输入了一段英文合同,点击“翻译成中文”。等了大概十秒,一段通顺的中文出现了。合伙人老李是个懂技术的,又问了几个关于文件格式、上下文长度的问题,林晚一一作答。
“你这模型是用什么数据训练的?”老李问。
“开源模型,通用数据。你们要是有自己的文档,我可以教你们怎么让模型学习。但那个需要更多计算资源,这盒子跑不了训练,只能推理。”
“够用了。”老赵当场拍了板,“先订十五台,下个月交货。”
十五台,按一台900算,就是一万三千五,扣除成本,利润至少有八千。林晚心里乐开了花,但脸上还是那副生无可恋的表情。
第四章 地下AI生态的崛起
老赵的订单只是个开始。
消息不知怎么传了出去,来林晚柜台打听“能跑AI的机顶盒”的人越来越多。有做跨境电商的,想用模型自动回复客服消息;有搞学术的,想在自己家里跑模型分析论文;甚至还有几个“特殊职业”的,想用离线模型处理敏感数据。
林晚意识到,自己可能踩到了一个风口。
他花了一周时间,把整个改装流程标准化了:
1. 硬件层:统一采用三星Z Flip5(骁龙8 Gen 2)或Z Fold4(骁龙8+ Gen 1)的碎屏主板,配上3D打印外壳、12V3A电源、铜管散热+涡轮风扇;
2. 存储层:预留一个USB3.0口,用户可以自己接移动硬盘。林晚建议用exFAT格式,因为NTFS在三星安卓上只能只读;
3. 系统层:基于AOSP打造了专属固件,取名“BrainCore OS”,内核精简到只有500MB,预装了llama.cpp、Ollama的安卓移植版、以及一个简单的Web管理界面;
4. 模型层:预装三个小模型——一个7B的通用对话模型(量化到int4),一个专门用来做翻译的3B模型,还有一个0.5B的摘要模型。用户可以自己从外置硬盘加载更大的模型,只要内存撑得住;
5. 应用层:通过局域网Web服务暴露API,电脑、手机、电视都能调用。还写了个简单的安卓App,可以直接在电视上用遥控器对话。
这套方案的成本被他压到了极致:主板回收价350元,外壳+散热+电源150元,32G emmc存储(实际板载)不用额外加,人工费每台算100元,总计600元成本。卖1200-1500元,利润翻倍。
三个月后,林晚的月销量突破了50台。他开始雇不起店员,自己一个人每天焊板子刷系统到凌晨两点。
第五章 被盯上的“垃圾佬”
一天晚上,林晚正准备收摊,一个穿着格子衬衫、背着登山包的年轻男人出现了。不是来买东西的,更像是来“调研”的。
“你就是网上说的那个‘机顶盒AI’的林老板?”年轻人自我介绍叫陈嘉文,是深圳一家AI初创公司的算法工程师。
“有事?”林晚警惕地看着他。
“我想跟你合作。”陈嘉文从包里掏出一块开发板,“这是我们公司自己设计的NPU加速模块,可以插在USB口上,把AI推理速度提升五到八倍。你那些骁龙8 Gen 2的盒子,加上这个,跑13B模型都能流畅。”
林晚接过开发板,翻来覆去看了几遍。做工粗糙,但芯片是正经的AI加速芯片,据陈嘉文说是国产的,算力有8TOPS。
“多少钱?”
“成本价180,我给你150。你把它集成到你的盒子里,整机能卖到2500。市场很大,不仅仅是普通用户——你知道现在有多少中小企业想用AI但买不起服务器吗?”
林晚沉默了一会儿。他当然知道,但他更清楚另一件事——这些大厂出来的工程师,口口声声说“合作”,实际就是想利用他的渠道和工艺,把自己的东西塞进去。
“我要先测试一下。”林晚说,“如果确实好用,我可以考虑。但我不接受独家绑定,你的模块我可以用,别人的我也可以用。”
陈嘉文愣了一下,显然没想到一个摆地摊的会有这种思维。他笑了笑:“行,林老板有原则。”
第六章 人工智能的“平民化”困境
陈嘉文的NPU模块测试结果出乎意料的好。
插上USB口,安装驱动后,原来跑7B模型每秒5个token的骁龙8 Gen 2,直接飙升到每秒25个token,几乎感觉不到延迟。而且功耗只增加了3瓦,风扇都不用换。
林晚立刻意识到,这东西有搞头。
但他也敏锐地发现了一个问题:这个NPU模块的驱动是闭源的,只有二进制文件,而且只支持特定的Linux内核版本。如果三星推送了系统更新,内核变了,驱动就得重新编译——而他不可能给每个用户都提供技术支持。
“你们能提供源码吗?或者至少保证三年内的内核兼容性?”林晚问陈嘉文。
陈嘉文面露难色:“这个……公司的IP政策不允许。但是我们可以签合同,承诺长期维护。”
林晚摇了摇头:“不是我不信任你,是我信不过任何一家公司。我这套盒子能活到现在,全靠开源社区和公版方案。你们这个模块一插上,我的整个生态就被你们绑架了。”
谈判不欢而散。
但林晚心里清楚,AI平民化的浪潮谁也挡不住。客户需要更强的算力,而骁龙8 Gen 2的极限就摆在那里。要么他找到更好的国产NPU方案,要么他自己学着写驱动——这对一个连大学都没上过的垃圾佬来说,几乎不可能。
第七章 转折:来自闲鱼的“神启”
事情的转机出现在一个不起眼的闲鱼订单上。
那天林晚收到一个包裹,里面是一块旧手机主板——型号赫然是传说中的骁龙8 Elite工程机,而且屏幕坏了,只要400块钱。
“捡到宝了。”林晚连夜测试,骁龙8 Elite的NPU算力直接飙到45TOPS,跑13B模型都不需要外挂模块,每秒18个token。
更关键的是,高通的AI引擎是开源的——至少驱动部分可以通过Hexagon SDK访问。林晚花了三天时间,硬啃英文文档,终于写出了一个简单的调用脚本,让llama.cpp可以直接使用骁龙8 Elite的NPU加速。
那三天是他人生中最痛苦的七十二小时。咖啡喝了三十多杯,烟抽了两条,眼睛酸得像进了沙子。但当他看到终端里跳出第一个token时,那种感觉比赚了一万块钱还爽。
他连夜改了设计方案,宣布推出“终极版”AI机顶盒——基于骁龙8 Elite,内置AI加速,不需要外挂任何模块,整机售价1999元。
消息在垃圾佬圈子里炸开了锅。
第八章 华强北的“AI叛乱”
半年后,林晚的柜台变成了华强北的一个传奇。
他不再自己焊板子了,雇了三个年轻学徒,专门负责焊接和组装。他自己则专注于软件优化,甚至开始教客户怎么训练自己的小模型。
老赵的公司用他的盒子跑了一个私有翻译模型,效果比Google翻译还好。消息传开后,深圳几家做跨境电商的小公司都来找他订货。
陈嘉文的公司终究没跟他合作,据说后来找了另一家更大的改装商,但销量一直上不去——因为他们的NPU模块总出驱动问题,客户退货率很高。
林晚偶尔会想,自己为什么会走上这条路。也许是因为他从小就喜欢拆东西——家里的闹钟、收音机、电视机,全被他拆过一遍。后来读到高中,家里没钱供他上大学,他就跑到深圳,从修手机开始,一步步做到现在。
“垃圾佬”三个字,在别人眼里是贬义,但他觉得是赞美。因为只有垃圾佬,才能从别人丢弃的东西里找到价值;只有垃圾佬,才能用最低的成本,撬动最前沿的技术。
第九章 尾声:属于每个人的AI
又一年过去。
林晚的AI机顶盒已经迭代到了第三版,累计卖出了两千多台。用户遍布全国,有律师、医生、教师,也有公务员、小店主,甚至还有几个高中生,用省下的零花钱买了一台,自己学着跑模型。
有天晚上,林晚收到一封邮件,寄件人是一个云南山区的乡村教师。信里说,他用林晚的机顶盒在学校里搭了一个“AI助教”,帮孩子们解答数学题、讲解课文,效果很好。但学校电压不稳,机顶盒老是自动关机,问有没有办法改成太阳能供电。
林晚看着邮件,愣了很久。
他想起自己小时候,村里唯一的电脑就是学校那台老掉牙的方正,开机要五分钟,运行个画图软件都卡。如果那时候有这么一台小东西,插上电就能用,还能解答问题……
他立刻回信:“你给我地址,我免费寄一台改进版过去,可以用12V蓄电池供电,配上太阳能板就行。不要钱,算我捐的。”
关掉电脑,林晚走到柜台前,看着堆成小山的机顶盒,忽然笑了。
什么人工智能大潮,什么资本泡沫,什么千亿参数模型——到最后,真正改变世界的,或许就是这样一个几百块钱的小盒子,和一些愿意折腾的人。
他拿起烙铁,继续焊下一块主板。
(未完待续)
——全文约8,700字(第一章至第九章)
后续章节将展开:林晚与陈嘉文的竞争、骁龙8 Elite货源争夺、国产NPU芯片的崛起、乡村AI教育的延伸故事……
夜雨聆风