左边一排工具,右边一堆面板,上面还有菜单、图层、通道、路径、蒙版、曲线、色阶、滤镜。你只是想把一张照片修得好看一点,软件却像把整间影楼、暗房和印刷厂都塞到了你面前。
Photoshop 统治了过去的修图时代,这点没什么好争的。
但问题是,大多数人并不想“会 Photoshop”。他们想要的是另一件事:把一张图处理成能用的样子。
证件照要干净,电商图要显得东西更值钱,海报要有冲击力,朋友圈照片要自然,不能一眼看出来脸被磨到像刚出厂。老板丢来一张活动现场图,说“做成小红书封面,标题区留右上,别太网红”,这句话分配的也不是一个 Photoshop 任务,它要的是一个结果。
回归到最最原始的需求看,P 图并不是点几个按钮。它是在处理一张图片里的信息:主体是谁,背景脏不脏,光线偏不偏,边缘干不干净,人物能不能修,标题放哪里不挡脸,最后这张图要发在哪里。
过去,这套判断只能被专业软件统治,被掌握了专业软件的公司收税。
你知道一张图哪里不对,但你不会抠图,不会调色,不会蒙版,不会局部重绘,最后还是改不了。于是软件变成了一道门。你想得到修图能力,就要先学会怎么进这道门,怎么认里面的按钮,怎么记住那些不太像人话的菜单。
软件公司过去很值钱,很大一部分原因就在这里:它把一门手艺,封装成了一个界面。
但在未来的 Agent时代,当智能体可以无限趋近于计算机最本质的操作后 软件公司赖以生存的本质开始松动了。
图片都是数字信息,只要是数字信息,理论上都可以被agent处理,只是在当下这个阶段的难易不同
如果一个智能体真的掌握了从原图到成品图的完整方法,它知道先检查主体,再处理背景,再调光线,再安排标题区,再按平台尺寸导出,还能回头检查有没有塑料感、有没有廉价模板味,那用户为什么一定要打开 Photoshop?
你可以直接说:
这张图帮我做成小红书封面。人保留真实质感,背景清理干净,标题区留在右上,整体别太像影楼。
一个足够成熟的agent加上图片 Skills,应该自己去拆这个任务。它会判断哪些地方能改,哪些地方不能乱动;哪些瑕疵要修,哪些纹理要留;哪些风格适合这张图,哪些一套上去就像十年前的微商海报。至于背后用了图像模型、画布、字体、蒙版、局部重绘,还是调用了 Photoshop,那是执行层的事。
用户绕开的不是图片处理。用户绕开的是“学习 Photoshop 操作”。
问题从这里露出来。
在agent的coding能力爆发之后,大家最先想的是软件变便宜了,然后被讨论的通常是“写一个系统更容易了”。
但再往下走一步,软件里的能力会被拆解出来,变成一个个可以被智能体调用的 Skills,最后大家其实发现,我们其实不需要GUI界面的软件。
Photoshop 是这样,Excel 也是这样。甚至我都不知道已经多久没有自己打开过PPT了
很多人说自己会 Excel,其实会的是一套按钮和公式。但公司要的不是“有人打开 Excel”,公司要的是一堆乱表变成可靠判断。字段怎么对齐,口径怎么统一,异常值该不该删,图表怎么画才不骗人,这才是 Excel 背后的手艺。
PPT 也是这样。会 PowerPoint 不等于会表达。难的是把一堆想法压成一个顺序,把主次排出来,把老板那句“这里再高级一点”翻译成页面结构,而不是加一条渐变线。
剪辑软件也是这样。会剪映不等于会做视频。一个视频为什么拖,哪里该切,哪里该停,哪里该让观众喘口气,哪里要补一句旁白,哪里应该把素材直接扔掉,这些判断比会不会点转场重要得多。
Figma、CRM、代码编辑器、财务系统,往下看都差不多。它们表面上是软件,往里看是一套处理信息的规矩:图片怎么变成可发布物,数据怎么变成判断,需求怎么变成界面,客户记录怎么变成下一步动作。
过去软件公司把这些规矩拆成按钮,让人一个个去学。Agent 时代会反过来,有人会把按钮重新组装成智能体能够工作。
修图会变成 Skills。
剪视频会变成 Skills。
做周报会变成 Skills。
写需求会变成 Skills。
投研分析、客服质检、合同审查、直播切片、选题研究,也都会变成某种 Skills。
这对软件公司其实很危险。
过去一个软件最大的护城河,经常不是技术,而是习惯。一个设计师学了很多年 Photoshop,就不想换;一个公司跑了十几年 Excel,就不敢动;一个团队的设计稿都在 Figma 里,迁移一次等于半条命没了。
这些锁定对人很有用,因为人怕麻烦。
但这些对agent是无效的
于是,软件公司要考虑下,在下一个时代,自己的护城河如何成立,如何变成面向agent有意义。
竞争的东西会彻底变化:用户每天打开谁,可能没有过去那么重要;Agent 做事的时候调用谁,会变得越来越重要。
它会把软件公司的价值拆成几层。
最底下还是能力。谁的图像处理更强,谁的视频生成更稳,谁的数据计算更可靠,谁的格式兼容更好,谁的权限和审计更安全,这些不会不值钱。只是它们未必还以一个每天被人打开的 App 存在,更可能藏在后面,变成 Agent 调用的能力引擎。
中间是方法。也就是谁能把一个岗位、一类工作、一门手艺拆得足够清楚,变成智能体可以稳定执行的流程。这里面不是写几句提示词就完了。一个好 Skill 里要有输入、步骤、判断、失败处理、质量检查和边界条件。它更像一个老师傅把自己干活的规矩写下来,而且写到机器也能照着做。
再往上是信任。
你不关心图片是不是 Photoshop 做的,你关心能不能发;
不关心表格是不是 Excel 算的,你关心数对不对;
不关心原型是不是 Figma 画的,你关心能不能开发、能不能用、会不会丑到同事沉默。哦对,如果大家不需要图形界面了,可能也没人关心figma了
软件公司以前卖入口,以后可能要卖三样东西:能力、凝练的方法论和可信结果。
这件事对普通人也有影响。
以前很多能力被软件门槛挡住了。你不会 Photoshop,就很难把图处理好;你不会剪辑软件,就很难做视频;你不会 Excel 高级函数,就很难处理复杂数据;你不会写代码,就很难把一个工作流自动化。
如果这些工作都开始 Skills 化,门槛不会消失,只会换地方。
以前的门槛是“你会不会操作软件”。以后的门槛是“你能不能说清楚一件事应该怎么做”。
你知道一张图为什么不好,应该怎么改,改到什么程度算过,什么地方不能乱动,这就是未来图片 Skill 的原料。
你知道一张表里哪个口径不对,哪个指标在骗人,哪个异常值不能直接删,这就是未来数据 Skill 的原料。
你知道一个视频为什么拖,哪里该切,哪里该停,哪里该让观众喘口气,这就是未来剪辑 Skill 的原料。
工具会越来越多,也会越来越便宜。稀缺的东西会往后退一步,变成把一件事拆成可执行、可检查、可复用的方法。
我们其实已经受够了各种复杂的软件,我们其实从来没有爱过工具栏。
用户爱的是那张终于修好的图,那份终于算对的表,那页终于能讲清楚的 PPT,那个终于能上线的页面。
如果 Agent 能从 0 到 1 把这些事做完,软件就不再是唯一入口。它要么变成更强的底层能力,要么变成更好的 Skills 供应商,要么就只能看着用户绕过去。
这大概就是软件公司的下一道题。
夜雨聆风