2026 年 AI Engineering 学习路线图:从零基础到构建可靠 AI 系统

2026 年开始 AI Engineering - 构建真实 AI 系统，大部分免费！

一份完整指南，帮助你在 2026 年从零基础开始并提升 AI engineering 能力，了解最新新闻、工具和最先进的技术。

我们现在已经有了一整套 AI engineering 课程，覆盖从入门 Python 到高级 agentic systems 的你所需内容。可在这里查看：Towards AI Academy。

我在社交媒体、社区、课程中，甚至在 Towards AI 为咨询工作招聘 AI engineers 时，总是被问到同一个问题：

“我怎样才能成为一名 AI engineer？”

有时它听起来像是：“如果我没有背景，该如何开始？”、“我需要先学 machine learning 吗？”、“我应该学 RAG、agents、fine-tuning 还是 prompting？”、“我能不能直接用 Codex 或 Claude Code，跳过无聊的部分？”或者“我到底应该构建什么才能被录用？”

所以我决定为任何想在 2026 年从几乎没有背景或零背景开始学习 AI engineering 的人，制作一份完整指南，而且大部分免费。

这份指南是我较早的 Start Machine Learning repo 的 AI engineering 版本，但已根据这个领域现在的真实样貌进行了更新。

而这个领域已经发生了很大变化。

几年前，很多公司主要会问：“我们能为这个训练一个模型吗？”或者“我们能在自己的数据上 fine-tune 一个 machine learning model 吗？”

现在，对大量团队来说，模型已经存在了。GPT 在那里。Claude 在那里。Gemini 在那里。Llama、Mistral、Qwen、DeepSeek 以及许多其他模型也都在那里。新的问题是：我们应该围绕这些模型构建什么，才能让它们可靠到足以使用？

这就是 AI engineering。

它不只是 prompting。它不只是构建 chatbots。它也绝对不只是打开一个 agentic coding tool，然后让它 vibe code 十个 demo。

AI engineering 是一种应用型技能：把 foundation models 转化为有用、可靠的系统。它是 product thinking、data、context、tools、retrieval、evals、deployment、monitoring、safety、cost 和 user feedback 在同一个系统中共同运作。

像 Codex、Claude Code、Cursor、Gemini CLI 以及类似工具这样的 coding agents 非常出色。你应该使用它们。我也在用。但使用 agent 更快地构建，并不等同于理解你构建了什么。

公司愿意付费购买的有价值技能是判断力：决定应该构建什么，在 prompting、RAG、fine-tuning、workflows、agents 或根本不用 LLM 之间做选择，证明系统有效，并在现实与预期不一致时改进它。

这才是本指南真正关注的重点。

在 GitHub 上找到完整且始终更新的列表：

GitHub - louisfb01/start-ai-engineering

维护者：Louis-François Bouchard，也活跃于 YouTube、X、LinkedIn、the What's AI Podcast 和 my newsletter。

如果你分享这个列表，请在 X @Whats_AI 或 LinkedIn 上标记我。

标记为 paid 的资源都已明确标注。除此之外，几乎所有内容都是免费的。一些课程和图书链接是 affiliate links，会在不增加你额外成本的情况下支持本指南。如果你使用它们，非常感谢，也祝你学习愉快。

不要害怕反复播放视频、重读文章，或者把同一个想法构建两遍。重复、debugging 和失败的项目，才是真正学习发生的地方。

2026 年谁可以成为 AI engineer？

本指南面向任何在 programming、artificial intelligence 或 machine learning 方面零基础或只有少量背景的人。

没有唯一正确的学习顺序，但经典路径是从上到下。如果你不喜欢书，可以跳过书籍部分。如果你不想跟在线课程，可以跳过课程，直接从 docs 构建。如果你已经会 Python，可以直接进入 AI engineering 部分。

目标不是强迫你走一条完美路径。目标是在网上信息显得嘈杂混乱时，给你一张清晰地图。

如果你已经进阶，可以把它当作 checklist。如果你是初学者，就按顺序学习，并注意难度等级。

难度等级

每个资源都有一个从 1️⃣ 到 🔟 的难度标记。

1️⃣ 表示绝对初学者，例如入门 Python 资源。3️⃣ 是对初学者友好的 AI 词汇。5️⃣ 是可以在项目中应用的实用构建者材料。7️⃣ 是生产工程深度。9️⃣ 是高级系统或研究。🔟 是那种 senior-level paper 或技术，你可能应该在交付过几个系统并稍微受过一些苦之后再回头看。以好的方式。大多数情况下。

我会遵循的学习路径

如果我今天从零开始，这是我大致会采取的路径：

观看一些基础视频，建立词汇和直觉。
选择一门免费课程和一个你承诺从头到尾阅读 docs 的 framework。
选择一两本书，建立一个扎实的基础，当工具变化时你可以回到这个基础上。
可选地参加一两门带真实项目的高级应用课程，尤其是如果你希望在自己动手搞坏东西之前获得结构和反馈。
构建两三个小但真实的项目，并让它们以有启发性的方式出问题。
在把任何东西称为 production-ready 之前，添加 evaluations、tracing、logging、cost tracking 和 deployment。

之后，你应该已经具备了成为一名扎实 AI engineer 的基础，足以胜任许多 entry-level 或转型岗位。最重要的是，持续学习并保持开放心态。这个领域变化很快，最好的 AI engineers 会保持好奇，而不是对某个 model、某个 framework 或某个 workflow 产生宗教式执念。

你可以用 AI 个性化这份 roadmap

你也可以把完整 GitHub repo 喂给你喜欢的 AI agent，让它根据你的背景、时间、预算和偏好的学习风格创建一个计划。

把下面内容粘贴到 Claude、ChatGPT、Codex、Cursor 或其他 assistant 中：

Use this repo as my AI engineering roadmap: https://github.com/louisfb01/start-ai-engineering

Create a personalized learning plan for me. First ask about my background, coding level, available time, budget, preferred learning style, and goals. Then choose the most relevant resources from the repo, explain why you picked them, order them from easiest to hardest, and turn them into a weekly plan with projects, checkpoints, and what I should be able to build after each stage.

使用 AI 更快地学习 AI engineering，而不是用它来逃避学习。

开始吧！先从简短的 YouTube 视频开始
没有 coding 背景也没关系
通过课程和 docs 开始认真学习
在线阅读文章
阅读重要书籍
练习、练习，再练习
Prompting 和 structured outputs
RAG、context engineering 和 vector databases
Tools、MCP、workflows 和 agents
Evaluations、observability 和 harnesses
Fine-tuning、multimodal、voice 和 deployment
AI coding agents 和 developer tools
AI safety、security 和 guardrails
更多资源：communities、newsletters、podcasts 和值得关注的人
如何找到 AI engineering 工作
总结

让我们开始学习 AI engineering！

在我看来，开始学习任何技术内容的最佳方式，是通过简短视频建立词汇和直觉。

不要一开始就试图记住每篇 paper、每个 framework 或每次 model release。先理解人们说 transformer、token、embedding、context window、RAG、reranker、tool call、agent、eval 和 hallucination 时到底是什么意思。

下面是我会从哪些视频开始。

4️⃣ AI Engineering Foundations: What Developers Actually Need to Know Today - 我的一小时 AI engineering foundations workshop。如果你想获得对本指南内容最清晰的概览，请从这里开始：LLMs 如何工作、它们的限制、何时使用 prompting、RAG、workflows 或 agents，以及为什么 evaluations 和 security 在 production 之前很重要。
2️⃣ How AI Works in Super Simple Terms - StatQuest with Josh Starmer。如果你完全是新手，这是最温和的入门入口。
2️⃣ Mastering AI Jargon - Your Guide to OpenAI & LLM Terms - 我制作的实用术语表，解释你经常在 OpenAI、GPT、LLMs、prompting 和 generative AI 周围看到的术语。
3️⃣ Intro to Large Language Models - Andrej Karpathy。一小时。仍然是对 LLM 是什么以及它如何工作最清晰的高层次导览之一。
4️⃣ AI Fundamentals for Builders - Understand transformers and fix LLM limitations - 面向构建者的课程，讲解 transformer 直觉、常见 LLM 限制，以及绕过这些限制所用的技术。
5️⃣ A Hackers' Guide to Language Models - Jeremy Howard，fast.ai。实用、代码友好，并面向构建者。
6️⃣ Deep Dive into LLMs like ChatGPT - Andrej Karpathy。更长、更深入，可能是你今年能做的最佳免费投入之一。

值得订阅的优秀 YouTube 频道：

2️⃣ StatQuest with Josh Starmer - 对 ML 和 neural network 概念最清晰的可视化解释。
3️⃣ 3Blue1Brown - 可视化数学和 deep learning 直觉。neural networks 和 attention 系列尤其有用。
3️⃣ DeepLearning.AI - 来自 Andrew Ng 团队的免费短课程和实用 AI engineering 主题。
4️⃣ What's AI - 我的频道，提供关于 RAG、agents、MCP、evals 以及如何推理 stack 的实用 AI engineering 解释。
4️⃣ Hugging Face - 覆盖 open-source AI 生态系统的官方教程。
5️⃣ LangChain - 关于 LangChain、LangGraph、agents 和 workflows 的官方教程。
6️⃣ Andrej Karpathy - 关于 LLMs 实际工作方式的长篇解释。
7️⃣ Umar Jamil - 面向想理解模型内部发生了什么的人的逐行实现。
8️⃣ Yannic Kilcher - 深入的 paper walkthroughs 和研究评论。

可以继续在 YouTube 上看视频。如果你认真选择，它仍然是最被低估的免费学习平台之一。

没有 coding 背景也没关系！

如果你完全没有 coding 背景，请从 Python 开始。

在接触 AI 之前，你不需要成为 software engineering 大师，但你确实需要足够的 Python 能力来阅读 docs、调用 APIs、处理数据、debug errors，并理解你的 coding agent 生成了什么。

从这里开始：

1️⃣ Learn Python - 免费交互式 Python 教程。
1️⃣ AI Python for Beginners - DeepLearning.AI。免费、友好，而且比完整 bootcamp 更轻量。
2️⃣ Python Fundamentals + CS Concepts - 我的 playlist，覆盖 Python 基础和核心 computer science 概念。
2️⃣ Beginner Python for AI Engineering - Towards AI。把 Python 作为处理 LLM systems 的实用工具来教授。付费。

如果你已经掌握基础 Python，可以直接进入指南的其余部分。

你不需要数学博士学位。你不需要在构建之前从零实现每个模型。但你需要足够的技术舒适度，来理解你正在交付的系统。

开始认真学习

一旦你具备一些词汇和 Python 基础，就选择一条结构化路径。

不要试图同时上十门课程。选择一门课程和一个 framework。承诺认真阅读 docs。不只是 quickstart。是 docs。

以下是我会首先推荐的课程和学习路径：

4️⃣ Hugging Face LLM Course - 免费。关于 tokenization、fine-tuning 和现代 transformers 的最佳免费结构化路径。
4️⃣ Anthropic Academy - 免费。包含 MCP 介绍和强 Claude 导向的学习资源。
5️⃣ Hugging Face Agents Course - 免费。使用 open-source models 讲解 agents、tools 和 orchestration。
5️⃣ LangChain Academy - 免费。贯穿 LangChain 和 LangGraph 的官方路径。
3️⃣ ChatGPT Prompt Engineering for Developers - DeepLearning.AI。免费，并且仍然是一个有用的起点。
4️⃣ Building Systems with the ChatGPT API - 免费。多步骤 chains、moderation 和初学者级 evals。
5️⃣ Improving Accuracy of LLM Applications - 免费。实用方法，帮助你从“它大概能用”走向更可靠的东西。

Towards AI Academy 路径：

2️⃣ AI for Work - 面向希望在工作中使用 AI 的非开发者。付费。
3️⃣ 10-Hour LLM Fundamentals - 紧凑 crash course，讲解何时使用 prompting、RAG、fine-tuning 或 agents。付费。
4️⃣ Get it all! From Novice to Expert Bundle - 如果你想从零学习整个 stack，这是最佳选择。付费。
5️⃣ Full Stack AI Engineering - 我们的旗舰开发者路径，覆盖 prompting、RAG、fine-tuning、tools、agents 和 deployment。付费。
7️⃣ Agentic AI Engineering - 高级课程，以两个 production agents 作为 capstones。付费。

如果你想要我的简单建议：如果你是新手，从一门免费课程加一个 framework 的 docs 开始。如果你想要结构和项目，选择一门与你水平匹配的 Towards AI 课程。

在线阅读文章

阅读很重要，因为文章会迫使你放慢速度并理解决策。

一个好的循环是：读一篇概念性文章，读一页官方 docs，自己构建一个极小版本，然后在你已经留下伤疤后重读那篇文章。第二遍的感受会非常不同。

以下是一些值得早期阅读的文章：

4️⃣ Here's how I use LLMs to help me write code - Simon Willison 使用 coding agents 的实用 workflow。
5️⃣ Your AI Product Needs Evals - Hamel Husain。关于为什么 evals 很重要的经典起点。
6️⃣ A Field Guide to Rapidly Improving AI Products - Hamel Husain。如何从“它大概能用”走向真实产品。
6️⃣ Building Effective AI Agents - Anthropic。关于何时使用 workflows 以及何时自治真正带来收益的参考文章。
6️⃣ Harness Engineering: The Missing Layer Behind AI Agents - 我的文章，讨论 prompt engineering 与可工作的 agents 之间的那一层：tools、permissions、state、retries、checkpoints、guardrails 和 evals。
6️⃣ Agents - Chip Huyen 关于 agent design 的长篇入门文章。
7️⃣ Context Engineering for LLMs: Build Reliable, Production-Ready RAG Systems - 实用 RAG 和 context engineering walkthrough。
7️⃣ 12-Factor Agents - Dex Horthy 的 production-agent checklist。
8️⃣ The Lethal Trifecta for AI Agents - Simon Willison 讲每个 agent builder 都需要理解的 security risk。

对于持续阅读，建议在 practitioner blogs、官方 engineering posts、Towards AI publication on Medium 和 Towards AI Newsletter 之间轮换，而不是依赖单一来源。

阅读重要书籍

书籍是可选的，但它们仍然是建立基础的最佳方式之一。

如果相比观看你更喜欢阅读，这条路径可以走得很远，尤其是那些专注于实际 coding 和 building 的书。

你不需要读完所有这些。请不要把学习变成囤书支线任务。根据你的水平和目标选择一两本即可。

5️⃣ Building LLMs for Production - Towards AI。覆盖 prompting、RAG、fine-tuning、reliability 和 shipping。Academy e-book version 也可获取。付费。
5️⃣ Hands-On Large Language Models - Jay Alammar 和 Maarten Grootendorst。可视化、code-first，并且非常适合建立直觉。付费。
5️⃣ Prompt Engineering for LLMs - John Berryman 和 Albert Ziegler。来自 GitHub Copilot engineers 的经过实战检验的 prompting patterns。付费。
6️⃣ The LLM Engineer's Handbook - Paul Iusztin 和 Maxime Labonne。面向 production，并围绕一个真实端到端项目构建。付费。
7️⃣ AI Engineering - Chip Huyen。在 system design、evaluation 以及每种技术何时值得采用方面很强。付费。
8️⃣ Build a Large Language Model From Scratch - Sebastian Raschka。如果你想从内部理解 tokenization、attention、transformer blocks 和 fine-tuning，这是合适的书。付费。

值得收藏的免费长篇解释：

4️⃣ The Illustrated Transformer - Jay Alammar。transformer architecture 的经典可视化参考。
5️⃣ Prompt Engineering - Lilian Weng。关于 prompting techniques 的研究导向概览。
5️⃣ Patterns for Building LLM-based Systems & Products - Eugene Yan。几乎每个已交付 LLM product 最终都会使用的七种 patterns。
7️⃣ LLM Powered Autonomous Agents - Lilian Weng。仍然是关于 agents 的参考文章之一。
8️⃣ Why We Think - Lilian Weng 关于 test-time compute 和 reasoning models 的文章。

练习、练习，再练习！

阅读和观看只能带你走到一定程度。

你通过构建会以有教育意义方式失败的系统，成为 AI engineer。

在开始构建之前，我建议观看这个视频：

在其中，我分享了我招聘 AI engineers 时看重什么，为什么 decision-making 比漂亮的 agent-generated output 更重要，以及哪些类型的项目真正能教授有用技能。

好的第一个项目：

4️⃣ 一个带 citations 和真实 eval set 的 document question-answering assistant。
4️⃣ 一个带 tool calls 和 structured outputs 的 customer support workflow。
5️⃣ 一个 research assistant，能够 plan、search、read 并写一份简短 brief。
5️⃣ 一个限定在某个狭窄 internal task 上的 coding helper。
5️⃣ 一个带 validation 的 multimodal invoice 或 receipt parser。
6️⃣ Designing Real-World AI Agents Workshop - Paul Iusztin 的 hands-on workshop，用于构建 Deep Research Agent 以及作为 MCP servers 的 LinkedIn Writing Workflow。
6️⃣ 一个小型 agent，能够在预算内 plan、act、check 和 retry。

参考 repos 和 tutorials：

3️⃣ OpenAI Cookbook - notebook 形式的官方 recipes。
4️⃣ Google Gemini Cookbook - Google 关于 multimodal、long context 和 tool use 的 recipes。
4️⃣ LlamaIndex Starter Tutorial - 快速搭建可工作的 RAG pipeline 的路径。
4️⃣ AI Engineering Cheatsheets - 我的 decision tables 和 playbooks，用于选择 approaches。
5️⃣ Pydantic AI docs - 来自 Pydantic 团队的 type-safe agent framework。
6️⃣ DSPy Tutorials - Prompt/program optimization tutorials。
7️⃣ Paul Iusztin's hands-on-llms repo - 带 training、serving 和 monitoring 的端到端 production project。

对于每个项目，强迫自己回答：

为什么选择这个 prompt、tool 或 architecture？
它会在哪里以及如何失败？
我将如何进行 offline 和 online evaluation？
当它表现异常时，我会 log 和 inspect 什么？
仍能达到标准的最便宜设计是什么？
这里 agent 真的是正确选择吗，还是 workflow 就足够了？

如果你回答不了这些问题，继续构建。

Prompting 和 structured outputs

Prompting 在 2026 年仍然重要。

但有用的版本不是魔法词或可爱技巧。它是为 non-deterministic systems 编写可靠 contracts。

你应该学习 task framing、output contracts、structured outputs、JSON schemas、few-shot examples、grounding、citations、verification loops、tool-use instructions、completion criteria 和 prompt versioning。

最佳资源：

3️⃣ OpenAI Prompt Engineering Guide - 官方且 API-centric。
3️⃣ Anthropic Prompt Engineering Overview - Claude-specific advice，但很容易泛化。
3️⃣ Learn Prompting - 免费、社区维护的参考资料。
5️⃣ OpenAI GPT-5 Prompting Guide - 来自 OpenAI 的 model-specific prompting advice。
5️⃣ Instructor: structured outputs with Pydantic - Jason Liu 用于 typed LLM outputs 的 library。
6️⃣ Structured Data Extraction from Unstructured Content Using LLM Schemas - Simon Willison 的 schema-first extraction pattern。

把 prompts 当作你会 version 的 code、你会 test 的 interfaces，以及你会重新审视的 product decisions。

RAG、context engineering 和 vector databases

RAG 仍然是核心技术，但朴素的“把一些 chunks 塞进 prompt”版本已经不够了。

你应该理解 chunking、embeddings、vector search、hybrid search、BM25、reranking、citations、provenance、metadata filters、query rewriting、corrective RAG、retrieval evaluation，以及什么时候 RAG 是错误答案。

从这里开始：

4️⃣ Why RAG Is Not Training Your AI - 我对大多数 builders 都搞错的 mental model 的解释。
4️⃣ LlamaIndex Introduction to RAG - 官方 docs，也是通向可工作 RAG system 最清晰的免费路径之一。
4️⃣ Pinecone RAG guide - vendor-written，但有扎实的介绍和图示。
5️⃣ Is RAG Still Needed in the Era of Long Context LLMs? - 有用的 decision framework。
6️⃣ Contextual Retrieval in AI Systems - Anthropic 的 contextual chunking pattern。
6️⃣ Hybrid Search RAG That Actually Works - 实践中的 BM25、vectors 和 reranking。
7️⃣ Systematically Improving RAG - Jason Liu 的 RAG iteration playbook。
8️⃣ Evolve or perish: The new RAG paradigm - Paul Iusztin 讨论 RAG 的发展方向。

Embeddings 和 vector databases：

4️⃣ Cohere Embed and Rerank
4️⃣ Voyage AI
4️⃣ Jina Embeddings
4️⃣ Nomic Embed
5️⃣ Hugging Face MTEB Leaderboard
4️⃣ Qdrant docs
4️⃣ Weaviate docs
4️⃣ LanceDB docs
4️⃣ Pinecone docs
4️⃣ pgvector
4️⃣ Chroma

不要停留在“上传 PDF，得到答案”。构建一个严肃的 RAG app，带 citations、retrieval debugging、chunking choices、metadata filters、eval set，以及检查 misses 的方式。

Tools、MCP、workflows 和 agents

如果 prompting 是 AI apps 的第一阶段，那么 tools 和 agents 就是真实能力与真实风险开始显现的地方。

Tools 让 model 能够行动。MCP 帮助把 models 连接到外部系统。Workflows 定义可预测步骤。Agents 动态决定步骤。

大多数团队应该从 workflow 开始。只有在自治能明确带来收益时，才添加 autonomy。

Tools 和 MCP：

5️⃣ Anthropic Tool use overview - tool calling 的清晰参考。
5️⃣ Introducing the Model Context Protocol - 原始 MCP 公告。
5️⃣ Model Context Protocol Getting Started - 官方 MCP docs。
5️⃣ Hugging Face MCP Course - 免费课程，覆盖 MCP clients 和 servers。
6️⃣ Anthropic Skills - 可复用 agent skills 和 instructions。
7️⃣ Writing effective tools for agents - Tool schemas、descriptions 和 error handling。
8️⃣ Model Context Protocol has Prompt Injection Security Problems - 在部署会接触 private data 的 MCP servers 之前请阅读。

Agents 和 workflows：

5️⃣ AI Agents in LangGraph - 与 Harrison Chase 和 DeepLearning.AI 合作的免费课程。
5️⃣ LangGraph docs - 面向 long-running、stateful agents 的 graph-based orchestration。
5️⃣ LlamaIndex Workflows - Event-driven workflows。
6️⃣ Building Effective AI Agents - 关于 agent vs workflow design 的参考文章。
6️⃣ Stop Building Agent Demos - 我关于 demo-to-production gap 的文章。
6️⃣ Agents and Workflows - 我关于何时 multi-agent 属于 overengineering 的文章。
6️⃣ Agent Architecture Guide - 我的 13 问题 decision framework。
7️⃣ 12-Factor Agents - Production-agent checklist。
7️⃣ Agentic AI Engineering - 我们的高级 agent 课程，带两个已交付 agent capstones。付费。
8️⃣ How we built our multi-agent research system - Anthropic 在一个已交付 multi-agent product 背后的真实 architecture。

Model 不是你的 system。Tool layer、state layer、eval layer 和 deployment layer 才是大部分真正 engineering 发生的地方。

Evaluations、observability 和 harnesses

这是大多数人跳过、然后以痛苦方式重新发现的一层。

如果你无法判断系统是否在改进，那你还不是在 engineering。你只是在移动 vibes。

你应该学习 golden datasets、rule-based checks、LLM-as-a-judge、regression testing、traces、spans、prompt versioning、error analysis、offline evaluations、online monitoring 和 harness design。

最佳资源：

5️⃣ Your AI Product Needs Evals - Hamel Husain。从这里开始。
5️⃣ LLM Evals FAQ - 对常见 eval 问题的实用回答。
5️⃣ Automated Testing for LLMOps - DeepLearning.AI 短课程。免费。
5️⃣ Ragas - Open-source RAG evaluation library。
5️⃣ LangSmith - 来自 LangChain 的 hosted tracing 和 eval tooling。
5️⃣ Arize Phoenix - 面向 LLM applications 的 open-source observability。
6️⃣ Harness Engineering: The Missing Layer Behind AI Agents - 我的文章，解释为什么 harnesses 区分 prototypes 和 production。
6️⃣ Harness engineering - OpenAI 对 coding agents 中同一层的 framing。
6️⃣ A Field Guide to Rapidly Improving AI Products - 实践中的 error analysis 和 data flywheels。
6️⃣ Task-Specific LLM Evals that Do & Don't Work - Eugene Yan 讨论 LLM-as-judge 在哪里有帮助、在哪里会误导。
7️⃣ Agent Observability and Evaluation: A 2026 Developer's Guide - 长篇实用指南。
8️⃣ Inspect AI - UK AI Safety Institute 的 open-source framework，用于 LLM evals。

在把任何东西称为 production-ready 之前，添加 evals、tracing、logging、cost tracking、latency checks，以及一种检查 failures 的方式。

Fine-tuning、multimodal、voice 和 deployment

Fine-tuning 仍然重要，但它不是大多数团队一开始应该拿起的第一把锤子。

只有在你理解 baseline 并且有 evals 之后，才进行 fine-tune。否则你是在朝一个模糊目标调参。

Fine-tuning 资源：

5️⃣ Building LLMs for Production - 仅 fine-tuning 章节就对许多团队很有用。付费。
5️⃣ Hugging Face smol fine-tuning course - 免费、code-first walkthrough。
5️⃣ OpenAI model optimization guide - 官方 docs。
6️⃣ Hugging Face PEFT docs - LoRA 和相关方法。
7️⃣ How to Fine-Tune LLMs in 2025 with Hugging Face - Philipp Schmid 最近很强的 how-to。
8️⃣ Improving LoRA: Implementing DoRA from Scratch - Sebastian Raschka。

Multimodal 和 document understanding：

4️⃣ Anthropic Vision docs
4️⃣ OpenAI vision guide
4️⃣ Google Gemini multimodal capabilities
5️⃣ Docling - IBM 的 open-source document extraction toolkit。
5️⃣ Document AI: From OCR to Agentic Doc Extraction - 免费 DeepLearning.AI 课程。

Voice 和 realtime AI：

4️⃣ ElevenLabs docs - Production voice cloning 和 streaming text-to-speech。
4️⃣ Deepgram docs - Low-latency speech-to-text。
5️⃣ OpenAI Realtime API - 原生 speech-to-speech 和 tool use。
5️⃣ Gemini Live API - Google 的 realtime multimodal endpoint。
5️⃣ Pipecat - Open-source voice agent framework。
5️⃣ LiveKit Agents - Realtime agent infrastructure。

Deployment、inference 和 open-weight models：

4️⃣ Ollama - 本地运行 open models 最简单的方式。
4️⃣ LM Studio - 用于 local inference 的图形界面。
6️⃣ vLLM docs - High-throughput inference server。
6️⃣ SGLang - Structured generation 和 batching。
6️⃣ Text Generation Inference - Hugging Face 的 production serving stack。
6️⃣ llama.cpp - 使用 GGUF quantization 的 CPU 和 edge inference。
5️⃣ Modal docs - 带干净 Python interface 的 serverless GPU compute。
7️⃣ BentoML LLM Inference Handbook - 免费、全面的 inference economics 手册。
5️⃣ LiteLLM - 面向 100+ LLM providers 的 open-source proxy。
5️⃣ OpenRouter - 跨多个 models 的 hosted router。

你应该能够解释为什么选择 API model 或 open-weight model，为什么 latency 和 cost 的 tradeoff 合理，系统在某个 dependency 失败时如何表现，以及你会如何 debug production 中的 bad output。

AI coding agents 和 developer tools

AI engineers 的工作方式在 2025–2026 年发生了变化。

Coding agents 和 agent-native editors 现在已经成为日常实践的一部分。使用它们。但再次强调，不要把思考外包出去。

值得学习的工具：

3️⃣ Claude Code - Anthropic 的 command-line coding agent。
3️⃣ Cursor - Agent-native IDE。
3️⃣ GitHub Copilot - 默认的 enterprise AI coding assistant。
3️⃣ Codex CLI - OpenAI 的 long-horizon coding agent。
3️⃣ Gemini CLI - Google 的 open-source command-line agent。
3️⃣ Windsurf - 专注于 context 和 flow 的 agent-native editor。

值得阅读的文章：

4️⃣ Here's how I use LLMs to help me write code - Simon Willison。
4️⃣ AI-assisted development needs automated tests - Simon Willison。
4️⃣ Identify, solve, verify - Simon Willison 的核心循环。
4️⃣ How to Solve It With Code - Jeremy Howard 的 AI-assisted problem-solving course。
5️⃣ What is agentic engineering? - Simon Willison 的工作定义。
6️⃣ Harness engineering: leveraging Codex in an agent-first world - OpenAI 的实用 framing。
6️⃣ Claude Code: How to Build, Evaluate, and Tune AI Agent Skills - 实用 SKILL.md 指南。

经验法则：选择一个 coding agent，坚持使用一个月，并深入学习它的 scaffolding。每两天在工具之间切换，通常比掌握一个工具更慢。

AI safety、security 和 guardrails

AI safety 不是可选项。

如果你的 AI system 可以 search the web、call tools、touch private data，或向其他 software 发送 actions，你就需要尽早思考风险。

学习 prompt injection、sensitive data handling、system prompt leakage、tool permissions、excessive agency、overreliance、output validation、human review thresholds、red teaming 和 governance。

从这里开始：

6️⃣ OWASP Top 10 for LLM Applications 2025 - 权威 security list。
6️⃣ OWASP GenAI Security Project - LLM security reference。
7️⃣ NIST AI Risk Management Framework - 美国政府参考 framework。
6️⃣ OpenAI Safety Evaluations Hub - 公开 safety evaluation results。
7️⃣ The Lethal Trifecta for AI Agents - Private data、untrusted content 和 external communication。
7️⃣ Embrace The Red - Johann Rehberger 的 red-teaming write-ups。
8️⃣ Design Patterns for Securing LLM Agents against Prompt Injections - 实用防御。
6️⃣ Guardrails AI - 用于 LLM output 的 validators 和 schemas。
6️⃣ Red Teaming LLM Applications - 免费 DeepLearning.AI 课程。
7️⃣ NVIDIA NeMo Guardrails
7️⃣ PyRIT - Microsoft 的 red teaming orchestration tool。

把 LLM output 当作来自一个行动很快、偶尔有外星直觉的实习生的工作。你不会盲目信任它。你会围绕它设计系统。

如何找到 AI engineering 工作

市场很混乱，但信号比人们想象的更清晰。

公司想要的是这样的人：能够接手一个模糊问题，做出合理假设，构建 baseline，评估它，记录 tradeoffs，并交付一些可测试的东西。

这比 trivia-style interviews 更接近真实工作。

最佳资源：

4️⃣ AI Engineering Cheatsheets - 你可以在面试中参考的 decision tables。
4️⃣ Towards AI Academy - 为招聘而设计的 certificate programs 和 portfolio projects。
5️⃣ What I Look For When Hiring AI Engineers - 我在招聘和面试 AI engineers 中的经验教训。
5️⃣ How to Work and Compound with AI - Eugene Yan 讲严肃 engineers 如何使用 coding agents 并随时间复利成长。
5️⃣ Identify, solve, verify - Simon Willison 讲雇主正在寻找的核心技能。
5️⃣ Your job is to deliver code you have proven to work - Simon Willison 讲 programming work 的转变。
7️⃣ How to Land a Frontier Lab Job - Vlad Feinberg 讲如何在 LLM stack 的边缘构建稀缺技能。

具体应该做什么：

交付两到四个公开项目，项目可以小，但必须严肃。

写简短 READMEs，解释你的 architecture choices、cost 和 latency tradeoffs，以及 failure modes。包含 tests 和至少一个 evaluation dataset。在相关时展示 traces、monitoring 或 experiment logs。

学会解释为什么你在某些地方选择不使用 agent。能够针对给定问题比较 prompting、RAG、fine-tuning、workflows 和 agents。

现在很多候选人都能生成代码。能展示判断力的人少得多。

总结

这是一份面向任何在 programming、AI 或 machine learning 方面零基础或只有少量背景，并希望在 2026 年成为 AI engineer 的人的指南。

它不是一份 exhaustive list。你可以根据自己的背景和学习风格使用更多资源、更少资源，或者完全不同的顺序。

重要的不是尽快完成这个列表。

重要的是建立判断力。

学习足够的理论，避免 magical thinking。学习足够的 tooling，快速构建。学习足够的 evaluation，信任你交付的东西。学习足够的 product judgment，避免更快地构建错误的东西。

最重要的是，持续交付。

这仍然是捷径。

这里是包含完整、更新列表的 GitHub repository：

https://github.com/louisfb01/start-ai-engineering

关注我们!与InfraLink共赴智能未来

🔗 聚焦数据科学|深耕算法创新|赋能AI工程化

📌 技术干货持续更新，全球生态合作共建

✨ 点击关注@InfraLink，解锁更多前沿技术资讯与实践洞察

2026 年开始 AI Engineering - 构建真实 AI 系统，大部分免费！

2026 年谁可以成为 AI engineer？

难度等级

我会遵循的学习路径

你可以用 AI 个性化这份 roadmap

目录

让我们开始学习 AI engineering！

没有 coding 背景也没关系！

开始认真学习

在线阅读文章

阅读重要书籍

练习、练习，再练习！

Prompting 和 structured outputs

RAG、context engineering 和 vector databases

Tools、MCP、workflows 和 agents

Evaluations、observability 和 harnesses

Fine-tuning、multimodal、voice 和 deployment

AI coding agents 和 developer tools

AI safety、security 和 guardrails

更多资源

如何找到 AI engineering 工作

总结