构建下一代 Agentic AI 应用的技术实践

导读本文整理自亚马逊云科技高级解决方案架构师姚远的技术分享。演讲系统阐述了 Agentic AI 的发展趋势与行业现状，剖析企业落地面临的五大核心痛点，并介绍亚马逊云科技通过 Strands Agents SDK 和 Amazon Bedrock AgentCore 八大组件提供的系统性解决方案，结合量化交易和生物医学两个实践案例，为企业构建生产级 Agentic 应用提供完整的技术路径参考。

主要内容包括以下几个部分：

1. Agentic AI 发展趋势

2. Agentic AI 发展痛点

3. 亚马逊云科技如何助力 Agentic 应用

4. AgentCore Demo

5. 客户实践案例

6. 总结

分享嘉宾｜姚远亚马逊云科技高级解决方案架构师

编辑整理｜曹芊芊

内容校对｜郭慧敏

出品社区｜DataFun

Agentic AI 发展趋势

从生成式 AI 的整体发展方向来看，当前行业呈现出"横向应用成熟、垂直应用起步"的格局。根据 A16Z 2025 年 10 月发布的研究报告，通用横向应用（如员工助手、聊天机器人）约占 60% 市场份额，其特点是覆盖广、易部署、通用性强，推广速度快，但收益较为分散；而垂直类应用（如供应链优化、研发决策等）虽然场景专精、价值高、集成深，却有约 90% 仍停留在试点（POC）阶段。

造成这一现象的根本原因在于基础模型能力与成本结构仍在快速演进，导致企业在垂直场景上的长期投入存在不确定性。过去几年，LLM 预训练的进展极为迅速，部分企业在模型尚未稳定的阶段便急于进行垂直方向的 Post-Training，往往导致投入大量资源打造的专有模型在基础大模型完成一次大版本迭代后便宣告废弃。当前，以 Claude、GPT 等为代表的基础大模型版本迭代幅度已趋于平稳，这正是深耕垂直应用、布局数据生态的合适时机。

从演进路径来看，AI 能力的发展经历了三个阶段：第一阶段是单纯的 LLM 调用——被动响应请求，完成孤立任务；第二阶段是单体 AI Agent——能够在目标驱动下自主完成一组不同任务，自动化整个工作流，融入短期/长期记忆、数据、API 及工具；第三阶段是当前正在兴起的 Agentic AI——由多个 Agent 协同工作，结合多模型混合使用，以最小化的人工介入实现高度自治。

02 Agentic AI 发展痛点

Agentic AI 的落地面临巨大挑战。根据 Gartner 2025 年 6 月的预测，到 2027 年底，将有超过 40% 的智能体 AI 项目因成本攀升、商业价值不明确或风险控制不足而被取消。

实践中可以看到，AI 编码能力的增强使得 MVP（最小可行产品）的原型开发变得极为简单，但从 MVP 到生产部署之间存在一道巨大的"鸿沟"：性能、可扩展性、安全、治理、商业价值验证，每一项都是必须跨越的障碍。当前，开发者在构建 Agentic 应用时面临四大核心痛点：

痛点一：工具集成难度高。Agent 需要接入 Memory、Web Search、Code Interpreter、Slack、Salesforce 等大量基础工具和外部工具，集成工作繁琐，拖慢开发速度。

痛点二：基础设施搭建超出能力边界。生产环境对会话隔离、状态管理、高可用性及弹性扩展的要求远超一般开发者的专业范畴。

痛点三：安全治理耗时费力。产品化过程中需要跨团队验证 Agent 调用、工具访问的身份验证与授权机制，过程繁复。

痛点四：非确定性应用监控复杂。Agent 的运行结果具有不确定性，需要精细化的端到端监控手段来确保可审计性和性能可达标。

03 亚马逊云科技如何助力 Agentic 应用

面对上述挑战，亚马逊云科技提供了两条核心路径：其一是降低单个 Agent 的开发门槛（Strands Agents SDK），其二是解决 Agent 的大规模生产部署问题（Amazon Bedrock AgentCore）。

1. Strands Agents：简化 Agent 开发

Strands Agents 是 AWS 开源的 Agent 开发 SDK，其核心设计理念是以极少量代码完成 Agent 的搭建与运行。它的核心是一个简单而强大的 Agent 循环（Agentic Loop）：接收用户输入→使用语言模型处理输入→决定使用工具收集信息或执行操作→执行工具并接收结果→用新信息继续推理→生成最终回复，如此循环迭代。

Strands Agents 具备四大能力：易用性（分钟级上手）、强大功能（内置 Tool、MCP Server，与 AWS 服务原生集成）、可扩展性（支持自定义模型供应商与工具）、快速开发（快速原型设计与迭代）。该 SDK 不与特定底层基础设施或模型绑定，能够适配多家模型供应商，并支持 MCP（Model Context Protocol）等主流协议。

2. Amazon Bedrock AgentCore：面向生产的完整底座

构建 Agent 只是第一步，实现大规模生产才是目标。AgentCore 是 AWS 专为 Agentic 应用生产化设计的托管服务平台，由八个核心组件构成，逐一击破前述五大痛点。

3. AgentCore Runtime（运行时环境）

Runtime 负责为 Agent 提供安全隔离的沙盒执行环境。其底层基于 AWS Lambda 所依赖的 Firecracker MicroVM 技术构建——与传统容器相比，MicroVM 在安全隔离性和冷启动速度上均有显著优势，同时天然具备 Lambda 级别的高并发处理能力。Runtime 采用 Session-based（会话基准）设计，每个用户会话都拥有独立的状态空间，从根本上解决了传统无状态容器方案在状态存储和扩展性上的难题。此外，MCP Server、Code Interpreter 和 Browser Use 等内置工具也同样运行在 Runtime 之上。

4. AgentCore Memory（记忆管理）

Memory 以 Serverless 方式提供托管记忆数据库服务，使开发者无需关注底层存储维护，只需专注于业务逻辑层面的记忆存取策略。它同时支持短期记忆（会话上下文）和长期记忆（对用户偏好与历史交互的提炼与保留），为 Agent 提供结构化的状态管理能力，弥补纯无状态架构在长期上下文处理上的局限。

5. AgentCore Gateway 与 Policy（工具网关与策略）

面对通用 Agent 动辄需要对接数千个工具的场景，Gateway 充当统一的工具网关层，提供工具注册、语义发现、索引查询等能力，类似于传统架构中的 API 网关。此次还新发布了配套的 Policy 服务：开发者可以用自然语言以声明方式描述访问策略（如"某员工调用 Agent 处理退款时，金额不得超过 1000 元"），系统在后台将其转化为结构化规则，在毫秒级别对每次工具调用进行实时策略校验，确保所有操作符合企业定义的安全边界与合规要求。

6. AgentCore Identity（身份管理）

Identity 服务将 Agent 视作一个"用户实体"，为其分配独立的数字身份，并管理其调用大语言模型、Memory、工具等各类 AWS 服务的访问权限。在动态生成 Agent 调用链路的场景下（开发者事先无法精确预知会调用哪些服务），Identity 提供了细粒度的权限管控机制，是 Agentic 应用安全合规落地的核心保障。

7. AgentCore Observability 与 Evaluations（可观测性与评估）

Observability 将 Token 消耗量、推理延迟、工具调用链路等关键指标可视化呈现于 CloudWatch 控制台，使运维人员能像监控传统应用的 CPU/内存一样实时掌握 Agent 运行健康状态。Evaluations（本次新发布）则更进一步，将 Agent 的"任务完成质量"纳入评估体系——开发者可在其中设定预定义能力维度或自定义评分指标，实现对 Agent 性能的持续自动化采样与评分，驱动产品迭代方向。

04 AgentCore Demo

已关注

关注

重播分享赞

视频详情

05 客户实践案例

1. MaxQuant.ai：Serverless 架构驱动的智能投资平台

MaxQuant.ai 基于 Serverless 架构和 AgentCore Runtime 构建了由 AgentFi 协议驱动的智能投资闭环平台。该架构以 Lambda 处理轻量任务、EventBridge 实现事件驱动，AgentCore 提供 Multi-Agent 底层能力，将核心业务模块的部署周期从 4 周缩短至 1 周。最终成果显示：运维工作量减少 90%，基础设施成本降低 50%，全天候自动化运营覆盖率达 90%，开发效率提升 10 倍，整体部署周期从六个月压缩到三周。

2. Biomni：整合 150+生物医学工具的科研 Agent

生物医学研究领域，研究人员 90% 的时间消耗在手动检索 PubMed 3800 万篇文献、多个公共数据库及内部海量细胞数据上。Biomni 借助 AgentCore 构建了整合 150 种工具、105 个软件包和 59 个数据库的通用型生物医学 AI Agent：Gateway 将所有工具集中化为可复用端点并提供语义搜索；Memory 维持跨会话的研究偏好与项目上下文；Identity 实现企业级 OAuth/IAM 双重认证；Observability 构建三层可观测性框架确保科学可重复性。最终，该平台成功将学术原型转化为生产级多团队系统，实现企业级安全部署。

06 总结

Agentic AI 正在加速垂直应用落地，但"实验容易、规模化难"的问题是横亘在开发者面前的现实挑战。走向生产的关键，不仅是"写一个 Agent"，更是补齐运行环境、记忆管理、工具治理、身份安全和可观测性这五个维度的架构底座。Strands Agents 与 Amazon Bedrock AgentCore 的组合，正是 AWS 为降低这一门槛而提供的系统性解答。对于企业而言，最务实的路径是：以业务 KPI 驱动迭代，优先跑通高频核心场景，再利用标准化组件快速复制到更多业务线。

以上就是本次分享的内容，谢谢大家。