在近日举办的第十六届双态IT用户大会上,海光信息聚焦金融AI应用迈向智能体时代的核心趋势,分享了AI基础设施的探索与实践。
当前,金融AI应用正从大模型探索迈向智能体落地新阶段。金融AI智能体强调任务理解、流程拆解、知识调用与工具协同,在制度查询、智能运维、合规问答、投研分析、客户服务等场景中完成从理解到辅助执行的闭环,推动AI从“能问能答”走向“能办事、能协同、能闭环”。这一转变对基础设施提出体系化要求:需高效处理海量多源数据,支撑长上下文、复杂工作流与高并发推理,同时满足低时延、安全合规和TCO可控。系统化的算力、互联、存储、软件栈与安全机制,成为智能体规模化落地的关键。

面对金融AI智能体的工程化挑战,海光信息以CPU+DCU双芯架构为基础,围绕算力、网络、存储、软件和安全进行全栈协同优化,推动AI基础设施从单一算力供给向系统能力建设升级。
算力层面,海光CPU持续增强性能,并提供国密协处理器、内存/虚拟机加密和可信计算等内生安全能力;DCU面向AI训练、推理和科学计算快速演进,全面支撑大模型与智能体的多样化部署需求。
软件生态层面,海光AI基础设施软件栈持续迭代,DTK、DAS、DAP等平台协同升级。DAP强化了模型、知识库、工作流与Agent开发接入能力,DAS优化大EP集群推理性能。目前海光已适配330余个大模型,覆盖DeepSeek、GLM、Kimi、Qwen等主流生态,帮助金融机构大幅降低迁移、适配和落地门槛。
安全是金融行业对智能体的核心关切。针对金融智能体面临的Token传输与计算等核心风险,海光基于双芯内置安全机制,探索“海光Token机密计算”能力,通过CPU安全容器与DCU之间数据加密传输保障Token传输安全,通过DCU内部HBM硬件级保护保障Token计算安全,为金融智能体提供全链条可信运行环境。
海光信息已在银行、保险、证券、支付等重点领域落地多类AI基础设施与智能体应用。
在某大型银行,海光DCU与智能体DAP平台软硬件深度融合,为大模型应用开发提供了全栈解决方案,集成了对话服务、RAG知识库、Agent智能体等核心应用能力,推动金融智能体在该银行快速投入实际应用。在保险领域,基于海光DCU的千卡算力平台支撑某大型保险公司实现全场景覆盖,涵盖AI智能助理、OCR识别、智能核保核赔、智能营销与风控等应用,服务车险、健康险、财产险等业务。在支付、证券等领域,智能运维、投顾问答、市场预测、语音质检等场景也已多点落地。
面向未来,海光信息将持续发挥CPU+DCU双芯优势,携手金融客户与生态伙伴,围绕智能运维、智能合规、智能风控、智能投研、智能客服、智能营销等重点场景,打造更多可复制、可推广的金融AI创新实践,为金融行业高质量发展筑牢国产智算底座。
夜雨聆风