这里整理入门友好、每日可碎片化学习的 AI 知识点,分基础概念、核心技术、实操常识、行业认知,每天一点,循序渐进。
第一阶段:AI 基础认知(1-10 天)
第 1 天:什么是人工智能(AI)
人工智能是让机器模拟人类感知、思考、决策、学习的技术统称,目标是让机器拥有类似人类的智能。
日常手机语音、拍照识物、聊天机器人、推荐算法,都属于 AI 应用。
第 2 天:弱 AI vs 强 AI
弱 AI(窄 AI):当下主流,只擅长单一任务,比如聊天、翻译、作图、导航,没有自主意识。
强 AI(通用 AI/AGI):理论形态,能像人一样学会所有智力任务,目前尚未实现。
第 3 天:三大分支:机器学习、深度学习、传统 AI
传统 AI:靠人工写规则,规则复杂就会失效;
机器学习(ML):让机器从数据里自己学规律,不用逐条写规则;
深度学习(DL):机器学习的分支,模仿人脑神经元结构,是现在 AI 大火的核心。
第 4 天:数据集 ——AI 的 “课本”
AI 靠数据学习,数据集就是训练用的资料。
数据质量、数量直接决定 AI 效果,“垃圾数据出垃圾 AI” 是行业常识。
第 5 天:训练、推理两个核心环节
训练:用大量数据教模型学习规律(耗时、耗算力);
推理:训练好的模型接收新问题,给出答案(日常使用阶段)。
第 6 天:模型是什么
AI 模型 = 经过数据训练后,存储了知识和规律的算法文件。
比如大语言模型、画图模型,本质都是不同功能的模型。
第 7 天:算力 ——AI 的 “动力”
算力指计算能力,GPU 是目前训练 AI 模型的核心硬件。
模型越大、数据越多,需要的算力就越强。
第 8 天:算法
算法是 AI 的解题思路,规定机器如何分析数据、总结规律。不同任务会搭配不同算法。
第 9 天:监督学习(最常用)
机器学习三大范式之一。
有标签数据学习:比如给图片标注 “猫 / 狗”,让 AI 学会区分猫狗。
第 10 天:无监督学习
没有标注答案,让 AI 自己挖掘数据里的规律。
典型应用:用户人群分类、内容聚类。
第二阶段:大模型 & 生成式 AI(11-20 天,当下主流)
第 11 天:生成式 AI
区别于传统 “识别、分类”AI,能主动创造新内容:文字、图片、音频、视频、代码都可以生成。
第 12 天:大语言模型(LLM)
专门处理文本的生成式大模型,核心是理解 + 生成人类语言,聊天、写作、翻译、写代码都靠它。
第 13 天:Token(文本最小单位)
大模型不会直接读汉字 / 单词,会把文字切分成Token。
模型有上下文窗口,超过长度就会遗忘前文内容。
第 14 天:提示词(Prompt)
你发给 AI 的指令,就是 Prompt。
清晰、具体的提示词,能大幅提升 AI 输出质量。
第 15 天:上下文(Context)
AI 当前能记住的对话 / 内容范围。
多轮聊天、长文档解读,都依赖上下文能力。
第 16 天:幻觉(AI Hallucination)
大模型常见问题:编造不存在的事实、数据、人名,看似合理实则错误,使用时需要核验。
第 17 天:微调(Fine-tuning)
在通用大模型基础上,用专属行业数据再训练,让模型适配专业场景(办公、医疗、电商等)。
第 18 天:RAG 检索增强生成
先从专属知识库检索真实资料,再让 AI 结合资料回答,大幅解决幻觉问题,企业 AI 常用技术。
第 19 天:参数(Parameter)
模型里的 “记忆单元”,参数数量常用来衡量模型规模。参数越多,理论上能力越强(非绝对)。
第 20 天:开源模型 vs 闭源模型
闭源:不公开代码和权重,如主流商用对话模型;
开源:代码 / 模型可免费下载、本地部署、二次修改。
第三阶段:视觉 & 多模态 AI(21-30 天)
第 21 天:计算机视觉(CV)
让机器 “看懂” 图片、视频,是 AI 视觉方向。应用:人脸识别、拍照翻译、监控识别。
第 22 天:卷积神经网络(CNN)
深度学习处理图像的经典网络结构,专门提取图片特征(轮廓、颜色、纹理)。
第 23 天:多模态 AI
同时处理文字、图片、语音、视频多种类型信息,比如 “看图说话、图文理解”。
第 24 天:文生图 AI
输入文字描述,AI 生成对应图片,核心是扩散模型技术。
第 25 天:扩散模型(Diffusion Model)
当下图文生成、视频生成的主流算法,通过逐步去除图片噪点,生成高清内容。
第 26 天:图像分辨率
AI 作图里常用概念,分辨率越高,图片越清晰,同时消耗算力越多。
第 27 天:图生图
以一张原图为基础,AI 修改风格、构图、细节,保留主体内容。
第 28 天:语音识别(ASR)
语音转文字,手机录音转写、语音输入都基于此技术。
第 29 天:语音合成(TTS)
文字转语音,AI 配音、有声书、智能播报均是该应用。
第 30 天:音视频 AI
结合语音 + 视觉,实现 AI 换声、视频配音、数字人播报等。
第四阶段:应用、伦理与安全(31 天 + 实用常识)
第 31 天:AI 落地场景
To C(个人):聊天、作图、剪辑、学习、办公;
To B(企业):客服、文案、数据分析、流程自动化。
第 32 天:AI 自动化(AIGC+RPA)
AI 结合自动化工具,替代重复办公操作:批量整理表格、自动发消息、文档汇总。
第 33 天:数据隐私风险
AI 训练、使用过程中,上传的文字、图片、个人信息有泄露风险,不要上传隐私内容。
第 34 天:AI 内容版权
AI 生成内容的版权、商用权限目前各地规则不同,商用前务必确认平台协议。
第 35 天:偏见与歧视
AI 会学习数据里的固有偏见,出现不公平判断,属于算法缺陷。
第 36 天:本地部署 AI
把开源模型装在自己电脑 / 手机,不上传网络,保护隐私、断网也能用。
第 37 天:AI 插件 / 工具扩展
给大模型加装插件,实现联网搜索、查文档、算数据、调用外部功能。
第 38 天:AI 评测
从准确率、速度、幻觉、逻辑性等维度,判断一个 AI 模型好不好用。
第 39 天:低代码 AI
不用写代码,拖拽式搭建 AI 应用,普通用户也能制作专属小工具。
第 40 天:AI 未来趋势
轻量化模型、端侧 AI(手机 / 本地运行)、行业专属模型、人机协同是主流方向。
夜雨聆风