InfiX.ai杨红霞:AI native的前提,是企业能训练自己的模型

企业用AI，最容易想到的是接入一个大模型接口。把内部知识库整理好，连上API service（接口服务），再做一个面向员工或客户的应用，似乎就能完成一次系统升级。

到了企业内部，问题很快会从“能不能调用模型”，转向“模型有没有真正吸收企业自己的数据”。医疗、金融、制造这类行业的关键数据，往往不在公开互联网上，而在医院、工厂、交易系统和企业内部流程里。模型可以被调用，并不代表这些数据已经进入模型。

在BEYOND Expo 2026数字AI峰会“AI原生企业：为全球舞台构建B2B智能架构”圆桌中，InfiX.ai创始人杨红霞把这个矛盾放进AI native（AI原生）的框架下。她给出的参照是Cloud Native（云原生）：过去20年，互联网经济能够快速扩张，背后离不开云原生服务和Linux操作系统。进入AI原生阶段，各行各业也需要新的基础设施，让企业能够用自己的领域数据训练自己的模型。

沿着这个判断往回看，过去几年大模型最先突破的任务并不难理解。写代码、解数学题和日常问答，都有大量互联网公开数据作为训练材料。公开数据越充足，模型越容易在这些任务上形成能力。

但行业数据的处境完全不同。一个顶尖医生的判断，来自长期病例、检查结果、诊疗流程和医院内部数据。企业里的生产、风控、供应链和客户数据，也长期沉在本地系统中。它们规模很大，却很难直接进入通用模型训练。杨红霞提到，一个通用大模型在预训练阶段可能使用100TB级别的token（词元）数据，而InfiX.ai接触的一些医院，线下数据规模可以达到几个PB，1PB相当于1000TB。

数据不是没有，只是很难被安全、低成本地用起来。企业调用大厂API service时，敏感数据可能需要被分享出去。把几个PB的数据搬到云上，成本和隐私、合规压力也会一起出现。于是，不少企业手里有数据，也想用AI，却很难真正把自己的领域数据训练进模型。

顺着这条线，InfiX.ai想解决的问题就不只是再做一个AI应用界面。杨红霞认为，未来能够改变各个行业的，仍然会是行业本身。企业缺少的，是把本地领域数据变成模型能力的基础设施。

而企业一旦要把自己的数据训练进模型，下一道门槛就是成本。杨红霞把大模型范式分成预训练、后训练和推理。预训练负责把大量专业数据注入模型，后训练通过supervised fine-tuning（监督微调）和reinforcement learning（强化学习）让模型更贴近任务，推理则对应模型进入应用后的执行过程。企业如果只停在推理调用上，很难让模型真正吸收自己的专业数据。

因此，成本压力会继续传导到训练侧，FP8、FP4也就有了位置。对大厂而言，多花时间和成本换取模型效果稳定，是可以接受的选择。但中小企业、机构和行业客户要真正用上大模型，训练成本必须降下来。InfiX.ai切入低比特训练，核心就是降低算力和存储消耗。

这里需要区分训练阶段的低比特路线和训练完成后的量化。后者是把已经训练好的模型继续压缩，可能影响reasoning（推理）这类高阶能力。杨红霞强调的路径，是从预训练、后训练阶段就采用低比特方式，在节省算力和存储的同时，尽量保留模型效果。

她还把FP4和未来硬件路线联系在一起。现阶段，训练大模型仍然高度依赖NVIDIA芯片，H series（H系列）芯片支持FP8，而下一代B series（B系列）Blackwell会转向FP4。从成本、模型performance（性能）和未来基础设施的角度看，FP4对应的不只是算法选择，也会影响训练基础设施的演进。

回到企业AI本身，真正的变化不会只发生在应用外层。数据留在谁手里，训练在哪里完成，成本能不能承受，都会影响AI能进入行业多深。杨红霞谈AI native，最后指向的也是这一点：让行业自己的数据和经验，真正进入模型训练。

END

BEYOND国际科技创新博览会

扫码关注我们

2027

澳门

不见不散