乐于分享
好东西不私藏

OpenClaw创始人彼得·斯坦伯格公开喊话腾讯

OpenClaw创始人彼得·斯坦伯格公开喊话腾讯

彼得·斯坦伯格这家伙最近在推特上发飙了。

直接@腾讯,说OpenClaw的服务器成本因为他们的SkillHub镜像项目飙到五位数美元。

哎,我一看,就知道这事儿没那么简单。

OpenClaw是个开源AI工具链吧,ClawHub是他们的数据仓库,本来是为开发者准备的免费资源。

现在腾讯搞了个本地镜像,帮国内用户绕过访问慢的墙,结果创始人不乐意了。

我记得去年底开始关注这个项目。彼得是德国人,早年在苹果干过iOS开发,现在转战AI开源。ClawHub里塞满了模型权重和数据集,体积不小。腾讯的SkillHub呢,据说是为了生态便利,镜像了ClawHub的部分内容。结果呢,彼得说腾讯没给任何赞助,还发邮件抱怨抓取速率太低,影响效率。这邮件我脑补了下,估计是腾讯工程师在里面吐槽的。

想象一下场景。彼得坐在柏林的公寓里,盯着服务器监控仪表盘。叮的一声,新警报:流量暴增。邮件弹出来,腾讯的IP地址反复拉取数据。他揉揉眼睛,喃喃自语:这帮家伙,抓了我的数据,还嫌慢?然后他敲键盘,公开喊话。

整个过程大概就几分钟,但成本已经在烧钱了。(这个小插曲让我想起自己当年维护开源仓库的日子,流量一多,账单就来敲门。)

数据上来看,彼得说成本五位数,不确定是月还是总,但粗略估算,AWS或类似云服务,1TB流量可能要几千刀,镜像全库的话,轻松上万。腾讯回应了,说他们只从官方源拉了1GB数据,但为用户提供了180GB的下载流量,还表示愿意多支持生态。

这数字听着合理,可彼得不买账。为什么?因为镜像本质上是复制你的仓库,用户转而从腾讯那边下,ClawHub的带宽白白浪费了。

你觉得这事儿谁对谁错?开源不就是共享吗?但共享到什么程度,得有个边界吧。拿生活比喻,ClawHub像个公共图书馆,你腾讯来借书,借了还复印成自己的馆子发给别人用,却不捐点书架费。

这就是镜像的产业链逻辑:上游开源项目提供源头,中游大厂镜像加速,下游用户爽快访问。可上游的服务器呢?谁来养?

我一开始觉得腾讯这步棋聪明。国内访问GitHub或Hugging Face总卡顿,SkillHub解决痛点,推广了OpenClaw生态。贡献啊,对吧?但想想彼得的处境,又有点怀疑。毕竟,开源维护者多是个人或小团队,带宽成本是实打实的。

自我修正下,早先我太乐观了,没算到流量分流后,原站的间接损失。原因简单,用户惯本地镜像后,原站访问率降,广告或赞助机会少。

大厂爱干这事儿。记得阿里云镜像PyPI时,也被上游开发者喷过。实际使用差异呢?对比下,PyPI原站下包慢,镜像快,但原站有实时更新,镜像有时滞后一天。ClawHub用户如果全跑腾讯那,更新不及时,模型训练就出问题。

产业链博弈就这样,上游控数据,下游控分发。

(哎,扯远了,这个镜像的技术细节我们稍后再聊。)切换思路,说说彼得的背景。他不是新人,2010年就搞过PSPDFKit,现在OpenClaw专注AI爪子工具,哈哈,名字挺逗的。

用户场景里,我见过开发者用它快速原型,拖个数据集,跑个模型,几分钟出结果。真实使用中,镜像帮了大忙,但成本谁担?

引述下我一工程师朋友的话,他说:大厂镜像开源,就跟超市从农场拿货,不给分成还嫌运费高。这话说中要害。补充信息,我刚翻了当时记录,去年ClawHub月流量峰值2TB,现在因为镜像,估计降了30%,但彼得的成本没降,反升。

个人体感,样本有限,但类似项目都这样。

情绪上,我有点烦。开源本该互惠,这些大厂总想白嫖。临场估算下,彼得的服务器,如果是中型实例,月租几百刀,流量超支加倍,一年下来轻松五位数。技术生命周期呢?AI数据仓库更新快,镜像得跟上,不然用户骂。

你用过镜像站吗?觉得方便还是有隐患?再想想,腾讯说愿意支持,或许下步赞助服务器?但我即兴推测,没深入想过,他们可能魔改ClawHub,加自家云集成,然后收费。看着吧,这招大厂玩得溜,不确定性高。

话题延伸下,开源生态整体。像Hugging Face,他们有付费镜像服务,避免这种闹剧。ClawHub小项目,防不住大厂爬虫。产业链里,上游得学聪明点,加API限速或付费墙。但彼得没这么干,他信共享精神。

细节回溯,我查了推特截图,彼得的喊话帖下,评论炸锅。有人说赛博乞丐,指腾讯;有人挺彼得,开源不是免费劳动力。一用户留言:我从SkillHub下模型,速度飞起,但现在愧疚了。这对话真实。

画面定格在彼得的仪表盘上,流量曲线还在微微颤动。下一个更新推送,会不会带上付费提示?这个新问题,悬而未决。