
企业用AI,最容易想到的是接入一个大模型接口。把内部知识库整理好,连上API service(接口服务),再做一个面向员工或客户的应用,似乎就能完成一次系统升级。
到了企业内部,问题很快会从“能不能调用模型”,转向“模型有没有真正吸收企业自己的数据”。医疗、金融、制造这类行业的关键数据,往往不在公开互联网上,而在医院、工厂、交易系统和企业内部流程里。模型可以被调用,并不代表这些数据已经进入模型。
在BEYOND Expo 2026数字AI峰会“AI原生企业:为全球舞台构建B2B智能架构”圆桌中,InfiX.ai创始人杨红霞把这个矛盾放进AI native(AI原生)的框架下。她给出的参照是Cloud Native(云原生):过去20年,互联网经济能够快速扩张,背后离不开云原生服务和Linux操作系统。进入AI原生阶段,各行各业也需要新的基础设施,让企业能够用自己的领域数据训练自己的模型。
沿着这个判断往回看,过去几年大模型最先突破的任务并不难理解。写代码、解数学题和日常问答,都有大量互联网公开数据作为训练材料。公开数据越充足,模型越容易在这些任务上形成能力。
但行业数据的处境完全不同。一个顶尖医生的判断,来自长期病例、检查结果、诊疗流程和医院内部数据。企业里的生产、风控、供应链和客户数据,也长期沉在本地系统中。它们规模很大,却很难直接进入通用模型训练。杨红霞提到,一个通用大模型在预训练阶段可能使用100TB级别的token(词元)数据,而InfiX.ai接触的一些医院,线下数据规模可以达到几个PB,1PB相当于1000TB。
数据不是没有,只是很难被安全、低成本地用起来。企业调用大厂API service时,敏感数据可能需要被分享出去。把几个PB的数据搬到云上,成本和隐私、合规压力也会一起出现。于是,不少企业手里有数据,也想用AI,却很难真正把自己的领域数据训练进模型。

顺着这条线,InfiX.ai想解决的问题就不只是再做一个AI应用界面。杨红霞认为,未来能够改变各个行业的,仍然会是行业本身。企业缺少的,是把本地领域数据变成模型能力的基础设施。
而企业一旦要把自己的数据训练进模型,下一道门槛就是成本。杨红霞把大模型范式分成预训练、后训练和推理。预训练负责把大量专业数据注入模型,后训练通过supervised fine-tuning(监督微调)和reinforcement learning(强化学习)让模型更贴近任务,推理则对应模型进入应用后的执行过程。企业如果只停在推理调用上,很难让模型真正吸收自己的专业数据。
因此,成本压力会继续传导到训练侧,FP8、FP4也就有了位置。对大厂而言,多花时间和成本换取模型效果稳定,是可以接受的选择。但中小企业、机构和行业客户要真正用上大模型,训练成本必须降下来。InfiX.ai切入低比特训练,核心就是降低算力和存储消耗。
这里需要区分训练阶段的低比特路线和训练完成后的量化。后者是把已经训练好的模型继续压缩,可能影响reasoning(推理)这类高阶能力。杨红霞强调的路径,是从预训练、后训练阶段就采用低比特方式,在节省算力和存储的同时,尽量保留模型效果。
她还把FP4和未来硬件路线联系在一起。现阶段,训练大模型仍然高度依赖NVIDIA芯片,H series(H系列)芯片支持FP8,而下一代B series(B系列)Blackwell会转向FP4。从成本、模型performance(性能)和未来基础设施的角度看,FP4对应的不只是算法选择,也会影响训练基础设施的演进。
回到企业AI本身,真正的变化不会只发生在应用外层。数据留在谁手里,训练在哪里完成,成本能不能承受,都会影响AI能进入行业多深。杨红霞谈AI native,最后指向的也是这一点:让行业自己的数据和经验,真正进入模型训练。
END
BEYOND国际科技创新博览会

扫码关注我们
2027
澳门
不见不散
夜雨聆风