✨职位信息概览
阿里巴巴集团招6个月软件工程师(淘宝直播)实习岗位,200-300元/天,工作地址:浙江-杭州-余杭区-老余杭-阿里巴巴西溪A区,面向本科及以上学历在读毕业生
📋岗位职责
- 需求理解与归因:
深入业务场景,利用数据挖掘与特征分析完成现象归因;精准识别高价值问题,将模糊的业务痛点转化为明确的 AI 解决目标 - 架构设计:
面向具体业务需求,设计 AI 原生系统架构;参与 Agent 系统核心模块的规划,包括记忆管理、推理策略与工具编排,兼顾架构的灵活性、可扩展性与工程可落地性 - 知识与环境构建:
搭建 AI 与现有业务系统的交互环境,涵盖 API 接入、RAG 知识构建、记忆方案设计;持续优化召回质量与上下文注入策略,为模型提供准确、及时的执行环境与知识支撑 - 核心能力实现:
负责 Agent 关键模块的工程落地,实现意图识别、任务拆解与反思纠错闭环;封装标准化 SDK/API 服务,构建 Agent 观测体系,实现全链路追踪与多维归因分析 - 系统迭代与演进:
建立搭建自动评测与回测机制,通过调优与 Case 分析不断收敛效果与性能提升的最优路径;沉淀方法论与可复用组件,推动 AI 能力从单点验证走向规模化落地 - 性能优化:
优化高并发场景下的系统性能,通过异步处理与降级策略保障稳定性,通过低侵入性观测手段保障系统的长期稳定运行
✅任职要求
海内外院校 2027 届毕业生,毕业时间:2026.11.01 ~ 2027.10.31 本科及以上学历 工作地点:杭州、北京任选 实习要求:4天/周,6个月 掌握 Java、MySQL、MyBatis、Redis、Spring 等核心技术栈 对 AI Agent、RAG、大模型应用有理解或实践经历 具备良好的系统设计能力和工程落地能力
加分项:
有 Agent 或 RAG 相关项目经验 参与过大模型应用的工程化落地 有高并发系统开发经验
📸招聘详情

💡应聘技术问题
问题:"淘宝直播场景下,如何设计一个 Agent 系统来帮助商家自动优化直播间的商品推荐?请从意图识别、任务拆解到执行闭环的角度分析。"
参考答案:
商家输入的指令往往很模糊,比如"帮我提升今天直播的转化率"。Agent 第一件事就是意图识别,把这类模糊说法映射到具体操作:是调推荐策略、改排品顺序,还是调话术节奏。结合历史行为和上下文做意图消歧,准确率能提不少。
意图明确后就是任务拆解。拿"提升转化率"来说,可以拆成:分析当前观众画像、比对历史高转化时段的商品排布、生成新排品建议、调整推荐权重、实时监控转化指标。每个子步骤对应一个工具或 API 调用。
拆解完要执行,执行完要反思。Agent 做完一组动作后,通过观测体系收集反馈(点击率、转化率、停留时长等),看效果是否达标。不行就触发反思,重新归因调整策略。闭环能不能跑通,取决于评估指标定义得够不够清晰,以及回退策略是否靠谱。
工程上,Spring 做服务框架,Redis 缓存热点数据和推荐结果,MySQL 存任务状态和执行日志,MyBatis 做持久化。全链路 Trace 让 Agent 每一步决策都可观测。
问题:"在电商直播高并发场景下,如何设计 Redis 缓存策略来保证 Agent 系统的实时性和稳定性?"
参考答案:
直播的并发特点是突发性强、峰值高(整点秒杀或主播喊"上链接"的瞬间),缓存策略要在性能和数据一致性之间找到平衡。
缓存分层方面:热点数据(在线人数、当前推荐列表)放 Redis,过期时间设秒级;用户画像和行为特征用 Hash 结构存,支持部分字段更新,省去全量写入的开销;Agent 生成的推荐结果按直播间维度缓存,key 设计成 live:{roomId}:recommend:{timeWindow},天然支持时间窗口淘汰。
高可用方面:缓存穿透用空值缓存或布隆过滤器拦;雪崩问题给同类 key 加随机偏移的过期时间;读请求走从节点,写请求走主节点,读写分离分担压力。
Redis 抖动或不可用的时候,系统要能降级到离线预计算的推荐结果,不能直接打穿数据库。本地维护一份轻量推荐快照做兜底就行。
问题:"Spring Boot 项目中如何实现 Agent 的异步任务调度和结果回调?请结合具体的技术方案说明。"
参考答案:
Agent 的任务通常是多步骤、长耗时的(调大模型生成推荐策略、调 API 执行、等业务反馈),同步处理会阻塞线程,扛不住高并发。
Spring 的 @Async 注解可以做基础异步执行,配合自定义线程池控制并发度,防止无界线程搞出 OOM。多步编排的 Agent 任务适合引入状态机:PENDING → RUNNING → WAITING_FEEDBACK → COMPLETED/FAILED,状态存在 MySQL 里,靠定时任务或消息队列驱动流转。
消息驱动方面,RocketMQ 或 Kafka 做任务分发和结果回调比较合适。Agent 执行完一个子步骤就发消息,下游消费者触发下一步。好处是天然支持重试、幂等和削峰。
执行完成后通过回调接口或事件通知上层业务。如果前端需要实时推送,Spring 的 SseEmitter 或 WebSocket 都能用。
问题:"描述一个你参与过的最有挑战性的项目,你在其中负责什么,遇到了什么技术难点,是如何解决的?"
参考答案:
面试官想听的是你怎么拆解问题、怎么做决策,技术名词堆多了反而减分。
项目背景用 30 秒说清楚:解决什么业务问题,规模多大。比如"做了个智能客服系统,日均 50 万次对话,要把大模型回答准确率从 70% 提到 90% 以上"。
你的角色和技术挑战控制在 1 分钟内,要说具体。别泛泛讲"做了性能优化",说"高并发下 RAG 召回延迟从 200ms 涨到 2s,查出来是 TopK 设太大导致计算瓶颈"。
解决过程花 1 到 2 分钟:分析了什么、试了哪些方案、为什么选了某个。比如"TopK 从 50 降到 20,配合 HNSW 索引优化,延迟降到 300ms,准确率只掉了 1.5%,在可接受范围内"。
最后 30 秒给结果,有量化数字最好,没有就说定性成果。加一句踩坑总结就够了。
问题:"如果让你从零搭建一个面向淘宝直播商家的 RAG 系统,你会怎么设计知识库的构建和召回策略?"
参考答案:
这个题考的是对 RAG 的理解和工程化能力,可以从数据采集、知识构建、召回策略三块展开。
知识库构建方面,数据来源主要有四块:商家商品信息(标题、描述、规格、历史销量)、直播话术库(历史高转化主播的话术片段)、平台运营规则(推荐逻辑、流量分配机制)、用户 FAQ。切分策略根据内容类型不同来定:商品信息按 SKU 粒度,每条一个 chunk;话术按语义段落切,保留上下文窗口;规则文档按条款切。每个 chunk 带上元数据(品类、直播间类型、适用时段等)方便后续过滤。向量化用 BGE 或 text2vec 生成 embedding,存到 Milvus 或 Elasticsearch 的 dense vector 字段。
召回策略用多路召回:向量相似度 + BM25 关键词,通过 Reciprocal Rank Fusion 融合结果。先按类目、时段等条件缩小候选集再检索,减少无关召回。然后用 Cross-encoder 或轻量 reranker 精排,取 Top-K 注入 prompt。
迭代方面,收集线上 Case 做标注,定期微调 embedding 模型或调 chunk 策略。同时盯着召回延迟,直播场景得秒级返回。
🎯应聘面试准备
问:想应聘上述岗位,需要做哪些准备?
答:
简历优化
1.核心信息前置
- 学历背景:
本科及以上,计算机科学、软件工程、人工智能等相关专业优先 - 工作经验:
如有 Agent、RAG、大模型应用相关的课程项目或实习经历,放在最前面 - 技术栈:
突出 Java(Spring 生态)、Redis、MySQL、MyBatis,以及 AI 相关(LangChain、向量数据库、Prompt Engineering) - 意向岗位:
软件工程师(AI 方向 / Agent 方向)
2.匹配岗位关键词
- 技术栈:
Java、Spring Boot、MyBatis、MySQL、Redis、Agent、RAG、大模型 - 工程能力:
系统设计、高并发处理、异步架构、API 设计、全链路追踪 - 工具与平台:
LangChain / LlamaIndex、Milvus / Elasticsearch、RocketMQ / Kafka、Docker - 能力标签:
意图识别、任务拆解、知识构建、观测体系、性能优化
技能梳理
Java 后端基础:
Spring Boot 自动配置原理、Bean 生命周期、事务管理 MyBatis 的缓存机制、动态 SQL、插件扩展点 Redis 五大数据结构的适用场景、持久化方案、集群模式 MySQL 索引优化、事务隔离级别、锁机制
AI 工程化能力:
Agent 的基本架构:感知 → 推理 → 行动 → 反思 RAG 完整流程:文档切分 → 向量化 → 检索 → 重排 → 生成 Prompt Engineering:Few-shot、Chain-of-Thought、ReAct 大模型调用方式:API 调用和开源模型本地部署
系统设计:
高并发设计思路:缓存、异步、降级、限流 分布式基本概念:一致性、可用性、分区容错 可观测性:日志、指标、链路追踪
面试准备
经典问题
Spring Bean 的生命周期是怎样的?循环依赖怎么解决? Redis 的持久化机制 RDB 和 AOF 各自的优缺点?生产环境怎么选? MySQL 的索引在什么情况下会失效?怎么通过 EXPLAIN 分析慢查询?
系统设计
设计一个直播间的实时推荐系统,要求支撑百万级并发 设计一个 Agent 的任务调度框架,支持多步骤编排和失败重试 设计一个 RAG 系统的知识库更新机制,保证在线服务的召回质量不退化
项目经验准备
准备1-2个核心项目的详细介绍,包括: 项目背景和目标 使用的技术和方法 遇到的挑战和解决方案 项目成果和收获 如果有 AI 相关的项目(哪怕是小项目),重点讲你是如何把模型能力工程化落地的 准备好回答"你为什么选择这个方向"和"你对 AI Agent 的理解"这类动机性问题
夜雨聆风