乐于分享
好东西不私藏

AI框架,算子,AI编译,工具链,全栈,runtime等岗位

AI框架,算子,AI编译,工具链,全栈,runtime等岗位

本平台专注IC&AI&汽车 行业职位招聘,擅长,数字设计,芯片架构,ESL,Validation,芯片验证, 芯片后端PR, DFT,STA,版图 ,模拟设计(ADC,DAC,PLL,Power,DC DC),算法,深度学习,视觉算法,嵌入式开发,内核开发,虚拟化,编译器,工具链 ,产品市场,销售,FAE,AE,FAB 设备 工艺 等相关职位,欢迎关注,咨询。

微信号:zyl889988  电话:13120709386

AI端侧推理框架及算子库设计架构师

岗位职责

1. 主导AI端侧推理框架整体架构设计,聚焦轻量化、低功耗、高吞吐需求,适配端侧AI芯片(NPU/边缘GPU),定义框架分层、模块接口及执行流程,支撑手机、物联网、边缘设备等端侧场景部署。

2. 负责端侧推理算子库架构规划与设计,覆盖CV、NLP等主流端侧模型算子,优化算子性能、内存占用,实现算子的可复用性、可扩展性,适配端侧硬件资源约束。

3. 协同编译器、Runtime、驱动团队,完成推理框架与底层软件的深度适配,优化端侧推理全链路延迟、功耗,平衡推理性能与资源开销。

4. 主导端侧推理框架与算子库的技术选型、迭代规划,跟踪端侧推理前沿技术(如量化推理、模型轻量化、异构调度),结合端侧业务场景输出架构优化方案。

5. 指导开发团队完成框架与算子库的设计、开发及落地,解决端侧场景下的兼容性、性能瓶颈等核心技术难题,保障产品稳定量产。

6. 对接端侧客户与业务团队,梳理场景化需求,输出针对性的推理框架与算子库适配方案,支撑客户项目快速落地。

任职要求

核心要求

1. 本科及以上学历,计算机、软件工程、电子工程等相关专业,5年+端侧推理框架、算子库设计或开发经验,有端侧AI芯片适配经验优先。

2. 精通端侧推理框架核心原理(如TensorRT Lite、MNN、TNN、TVM端侧部署),具备端侧推理框架整体架构设计实战经验。

3. 深入理解端侧AI芯片架构,精通端侧推理算子设计、优化技巧,能结合端侧资源约束(低内存、低功耗)设计高效算子库。

4. 精通C/C++,熟悉PyTorch/TensorFlow模型量化、导出、部署流程,具备轻量化模型(如MobileNet、YOLO-Lite)推理优化经验。

5. 具备优秀的架构设计、问题拆解与跨团队协同能力,能独立主导端侧推理框架与算子库的架构设计、论证及落地,适配端侧多场景需求。

AI编译器架构师/资深架构师

岗位职责

1. 主导AI芯片编译器全栈架构设计,基于MLIR/LLVM框架,定义各模块方案及接口,适配多代芯片演进。

2. 负责计算图优化、算子生成、指令调度等核心技术架构,突破性能瓶颈,发挥芯片PPA优势。

3. 跟踪前沿技术,制定编译器技术路线,协同团队完成与主流AI框架的对接适配。

4. 跨团队协同解决软硬件适配问题,指导工程师工作,推进架构落地及迭代优化。

5. 牵头攻关编译器开发中的重大技术难题,保障产品稳定性与可靠性。

核心技能

1. 本科及以上学历,相关专业,5年+AI编译器、异构计算相关工作经验,主导过核心编译器项目架构设计。

2. 精通MLIR/LLVM框架,理解编译器全流程,具备自定义IR设计、指令调度实战经验。

3. 熟悉AI芯片架构,具备软硬件协同设计思维,能结合硬件特性做编译优化。

4. 精通C/C++/Python,扎实的算法基础,熟悉并行计算、图优化等技术。

5. 具备优秀的架构设计、问题拆解能力,能独立主导复杂技术方案落地。

加分项

1. 有TVM、TensorRT等主流AI编译器开发或架构经验者优先。

2. 有AI框架与编译器对接、量产级产品交付经验者优先。

3. 有开源项目贡献、相关论文或专利,具备团队管理经验者优先。

岗位优势

1. 深耕AI芯片核心赛道,参与下一代编译器技术定义,直面前沿挑战。

2. 顶尖团队协作,资源充足,拥有完善的架构师晋升通道。

3. 主导核心架构设计,具备充分技术决策权,助力个人专业成长。

AI工具链架构师

岗位职责

1. 主导AI模型压缩工具链架构设计,覆盖量化、剪枝、蒸馏等核心功能,适配公司AI芯片特性,打造高效、易用的端到端压缩工具。

2. 负责性能分析工具架构规划,设计模型训练/推理全链路性能监控、瓶颈定位、可视化分析方案,支撑性能优化落地。

3. 协同编译器、Runtime、框架适配团队,优化压缩后模型的部署兼容性与执行性能,平衡模型精度与压缩比。

4. 指导开发团队完成工具链开发与迭代,制定性能分析标准与优化方法论,解决工具链落地中的技术难题。

5. 跟踪模型压缩与性能分析前沿技术,结合芯片与业务需求,制定工具链技术路线图,提升工具链竞争力。

6. 对接客户需求,输出针对性的模型压缩与性能优化解决方案,支撑客户项目落地。

核心技能

1. 本科及以上学历,计算机、软件工程等相关专业,5年+模型压缩、性能分析或AI工具链架构设计经验。

2. 精通模型压缩核心技术(量化、剪枝、蒸馏等),具备端到端压缩工具链架构设计或开发实战经验。

3. 熟悉AI芯片架构与软件栈,具备模型性能瓶颈分析、调优经验,能针对性设计性能分析工具。

4. 精通C/C++/Python,熟悉PyTorch/TensorFlow等主流框架,了解编译器、Runtime底层原理者优先。

5. 具备优秀的架构设计、问题拆解与跨团队协作能力,能独立主导工具链架构落地与迭代。

加分项

1. 有AI芯片专属模型压缩工具链、性能分析工具量产交付经验者优先。

2. 熟悉TVM、TensorRT等工具链,有大模型压缩与性能优化经验者优先。

3. 有开源模型压缩或性能分析项目贡献经验,或相关技术专利、论文者优先。

4. 具备端侧推理场景下性能分析与优化经验者优先。

AI全栈软件架构师

岗位职责

1. 主导AI芯片全栈软件架构设计,统筹编译器、Runtime、驱动、框架适配、工具链等全模块,定义整体架构蓝图、模块划分及接口规范,确保各环节协同高效。

2. 负责软硬件协同设计,与硬件架构团队深度协作,共同定义ISA、硬件抽象层,推动软件架构与芯片硬件特性深度适配,最大化发挥芯片PPA优势。

3. 制定AI软件栈技术路线图,跟踪全栈前沿技术(框架、编译、异构计算等),结合公司芯片定位(推理/端侧),输出技术选型与架构迭代方案。

4. 统筹推进全栈架构落地,协调各领域架构师(编译器、框架、Runtime等),解决跨模块、跨领域的技术冲突与瓶颈,保障全栈软件的稳定性、可扩展性。

5. 主导核心技术难题攻关,针对全栈性能优化、生态兼容、多代芯片适配等关键问题,输出系统性解决方案,支撑产品量产与客户落地。

6. 负责技术战略落地与跨部门协同,对接研发、产品、客户团队,传递架构理念,推动架构规范执行,平衡技术理想与业务落地需求。

任职要求

核心要求

1. 本科及以上学历,计算机、电子工程等相关专业,8年+AI领域技术研发经验,5年+AI全栈软件架构设计经验,有AI芯片相关从业经历优先。

2. 精通AI全栈技术栈,深入理解编译器(MLIR/LLVM)、Runtime、设备驱动、主流AI框架(PyTorch/TensorFlow)核心原理,具备全栈视角的架构设计能力。

3. 具备扎实的软硬件协同设计思维,熟悉AI芯片(GPU/NPU/TPU)架构,能结合硬件特性设计最优软件架构方案。

4. 精通C/C++/Python,具备分布式计算、大规模模型部署相关经验,能主导全栈性能优化与技术难题攻关。

5. 具备优秀的战略思维、架构判断力与跨团队协同能力,能独立主导复杂全栈架构的设计、论证与落地,具备较强的创新意识与问题拆解能力。

运行时(Runtime)与驱动架构师

岗位职责

1. 主导AI芯片运行时(Runtime)整体架构设计,负责任务调度、内存管理、队列管理及异构计算协同方案规划。

2. 负责AI芯片设备驱动架构设计与技术选型,打通底层硬件与上层软件的交互链路,定义驱动接口规范。

3. 优化Runtime调度策略、内存分配机制,解决低延迟、高并发场景下的技术瓶颈。

4. 跨团队协同编译器、框架适配团队,推进Runtime与驱动和上层软件的协同适配,保障全链路稳定性与效率。

5. 跟踪Runtime与驱动前沿技术,制定技术路线图,指导开发团队落地架构方案,推动架构迭代优化。

6. 牵头攻关Runtime与驱动相关重大技术难题,保障产品量产落地及客户场景适配需求。

任职要求

核心要求

1. 本科及以上学历,计算机、电子工程等相关专业,5年+异构计算Runtime/设备驱动架构设计或开发经验。

2. 精通Linux内核驱动开发,深入理解设备驱动模型,具备AI芯片(GPU/NPU/TPU)驱动架构设计经验。

3. 深入理解Runtime核心原理,具备任务调度、内存管理、分布式通信相关架构设计能力。

4. 精通C/C++编程语言,熟悉CUDA/HIP或自研异构计算API,了解互联协议(PCIe等)。

5. 具备优秀的架构设计、问题拆解及跨团队协作能力,能独立主导复杂技术方案的落地。