青岛实习|AI 与软件开发实习生岗位|170-220 元/天-夜雨聆风

青岛实习|AI 与软件开发实习生岗位|170-220 元/天

✨职位信息概览

歌尔股份（Goertek）招3个月AI 与软件开发实习生岗位，170-220 元/天，工作地址：青岛崂山区歌尔研发大楼，面向硕士及以上学历在读毕业生

📋岗位职责

参与图像处理、计算机视觉、机器学习相关算法研发与实现；
负责 AI 模型调研、微调、训练迭代与效果优化；
协助 AI ISP 算法调试、画质评测与数据分析；
使用 AI 辅助编程工具进行脚本开发、自动化测试与工程化部署；
与算法、开发、测试团队协同对接需求、解决问题，完成算法与项目相关文档编写。

✅任职要求

全日制硕士在读，电子信息、计算机、自动化、软件工程、人工智能等相关专业；
熟悉 C/C++、Python 等编程语言，具备扎实的编程基础；
了解深度学习原理与常用网络结构，熟悉 PyTorch / TensorFlow 等至少一种深度学习框架；
熟悉图像处理、计算机视觉、ISP 流程等基础理论与算法；
学习能力强，踏实严谨，具备良好的沟通协作与问题解决能力。

加分项：

有模型量化、剪枝、部署经验，熟悉 TensorRT 等推理框架；
有 OpenCV 开发经验或图像/视频相关项目、竞赛经历；
在会议/期刊上发表过论文，相关比赛获奖，及持有相关专利者优先。

📸招聘详情

💡应聘技术问题

问题：”请解释卷积神经网络中感受野的概念，以及如何增大感受野？”

参考答案:

感受野（Receptive Field）是输出特征图上一个像素对应到原始输入图像的区域大小，简单说就是网络这一层能”看到”多大范围的信息。

几种常用的扩大方式：

堆叠卷积层：两个 3×3 卷积叠起来的感受野等于一个 5×5，但参数更少。
池化或步长 > 1 的卷积：下采样之后，后面的层每一点对应的输入区域会变大。
空洞卷积（Dilated Convolution）：卷积核元素之间插入空洞，不增加参数就能扩大覆盖范围，语义分割里用得很多。

问题：”ISP 流水线中常见的处理模块有哪些？各自的作用是什么？”

参考答案:

ISP 把传感器输出的 RAW 数据处理成能看的图像，主要模块按处理顺序大致有：

黑电平校正（BLC）：去掉传感器暗电流带来的偏移，让暗场景下信号归零。
镜头阴影校正（LSC）：镜头边缘会偏暗、偏色，这个模块做补偿。
坏点校正（DPC）：修掉传感器上的死像素。
去马赛克（Demosaic）：Bayer 格式的 RAW 是单通道的，需要插值出 RGB 三通道。
白平衡（AWB）：根据光源调整 R/G/B 增益，让白色在画面里真的是白色。
色彩校正矩阵（CCM）：把传感器的色彩空间转到 sRGB 这类标准空间。
伽马校正（Gamma）：做非线性亮度映射，匹配人眼的感知特性。
降噪（NR）：去掉高 ISO 或暗光下的噪点。
边缘增强（EE）：提升清晰度，一般放在降噪后面。
色调映射（Tone Mapping）：HDR 场景里压缩动态范围，同时保留亮部和暗部细节。

问题：”什么是模型量化？INT8 量化相比 FP32 会带来哪些影响？如何减少精度损失？”

参考答案:

量化就是把模型里的 FP32 权重和激活值转成低比特整数（比如 INT8），好处是模型变小、显存占用降低、推理变快。在支持 INT8 的硬件上（TensorRT、移动端 NPU），速度通常能快 2-4 倍。

代价是精度会掉：数值范围和分辨率都变小了，分布特别广或者有离群值的张量受影响比较大。

减少精度损失的办法：

校准（Calibration）：拿一批有代表性的数据跑一遍，统计每层激活值的实际分布，据此确定 scale 和 zero-point。比直接用全局 min/max 效果好。
对称量化 vs 非对称量化：看数据分布选合适的。
逐通道量化（Per-channel）：权重按输出通道分别算量化参数，比逐张量精度高。
混合精度：量化后掉分明显的层保留 FP16/FP32，其他层用 INT8。
量化感知训练（QAT）：训练时就模拟量化，让模型提前适应低精度。一般比训练后量化（PTQ）精度更高，但需要重新训练。

问题：”描述一个你参与过的图像处理或深度学习项目，你在其中负责什么？遇到了什么挑战？”

参考答案:

这类题没有标准答案，但面试官想看的是你做事的思路，不是背出来的流程。按 STAR 结构组织会比较清楚：

Situation（背景）： 项目是干什么的，业务需求是什么。比如”团队要做一个工业缺陷检测系统，要求在嵌入式设备上实时跑”。

Task（任务）： 你负责哪一块。比如”我负责检测模型的训练调优和压缩部署”。

Action（行动）： 具体怎么做的。比如”我用 YOLOv8 做检测，小目标缺陷识别不好，就调大了输入分辨率并改了多尺度特征融合；部署端用 TensorRT 做 INT8 量化，配合校准数据集调参”。

Result（结果）： 最后效果怎么样。比如”测试集 mAP 94.5%，INT8 量化后精度掉了不到 1%，推理从 45ms 降到 12ms，满足了产线要求”。

回答的关键是讲清楚为什么这么选、遇到问题怎么分析的，别光列”我做了什么”。

问题：”如果 AI ISP 算法在低光照场景下画质明显下降，你会如何排查和优化？”

参考答案:

按模块逐层排查：

1. 先看数据：

查低光照下 RAW 的信噪比，看噪声是不是已经超出了预期。
把正常光照和低光照的 RAW 数据分布拉出来对比，看有没有异常截断或者饱和。

2. 逐个模块排查：

降噪（NR）：暗光下噪声本来就大，降噪不够会留噪点，降过了细节全没了。可能需要调参数或者换深度学习降噪方案。
白平衡（AWB）：低色温光源下容易失效，看看 R/B 通道增益对不对。
伽马和色调映射：暗区拉伸不够的话细节就丢了，检查 gamma 曲线和 tone mapping 参数。
黑电平校正：BLC 不准的话暗区会偏色、出色块。

3. AI 模型层面：

看训练数据里低光照样本够不够，不够就加数据增强或者多采集。
观察模型在低光照输入下的特征图，看有没有特征退化。
可以试试加光照感知的条件输入，让模型根据场景亮度自动调整策略。

4. 端到端方案的话：

在 loss 里给暗区加权重，让模型更在意低光照区域的质量。

🎯应聘面试准备

问：想应聘上述岗位，需要做哪些准备？

答：

简历优化

1.核心信息前置

学历背景：全日制硕士在读，电子信息、计算机、自动化、软件工程、人工智能等相关专业
项目经历：把实验室课题、校企合作或个人开源项目里跟 CV/深度学习相关的经历往前放
技术栈：C/C++、Python、PyTorch/TensorFlow、OpenCV
意向岗位：AI 算法工程师 / 计算机视觉工程师（实习方向）

2.匹配岗位关键词

技术栈：C/C++、Python、PyTorch、TensorFlow、TensorRT、OpenCV
工程能力：模型训练与微调、模型量化与部署、自动化测试、脚本开发
工具与平台：Git、Linux、CUDA、TensorRT
能力标签：图像处理、计算机视觉、ISP、深度学习、AI ISP

技能梳理

编程基础（C/C++ & Python）：

指针、内存管理、STL 容器这些 C++ 基础要能讲清楚
NumPy、OpenCV-Python 的常用操作要熟练
了解一下 C++ 调 Python 模型的混合编程（比如 pybind11）

深度学习基础：

CNN 基本组成：卷积、池化、BN、激活函数、感受野怎么算
常见网络：ResNet、MobileNet、YOLO 系列、UNet
训练技巧：学习率调度、数据增强、正则化、loss 怎么选
能用 PyTorch 自己搭一个视觉模型跑通训练和验证

计算机视觉与图像处理：

传统图像处理：滤波、边缘检测、直方图、色彩空间转换
常见任务：目标检测、语义分割、图像分类的常用方案
ISP 基本流程：RAW → Demosaic → AWB → CCM → Gamma → NR → EE

模型部署与优化（加分方向）：

TensorRT 基本流程：ONNX → Engine → 推理
量化原理（FP32 → INT8）和校准方法
模型剪枝、知识蒸馏的思路

面试准备

经典问题

感受野怎么算？1×1 卷积有什么用？
BN 的原理，训练和推理阶段有什么区别？
过拟合怎么看出来？常用的正则化有哪些？

系统设计

工业缺陷检测系统怎么设计？从数据采集到部署的完整链路
PyTorch 训练的视觉模型怎么部署到嵌入式设备？要考虑什么？
AI ISP 和传统 ISP 各有什么优劣？目前 AI ISP 的主要难点在哪？

项目经验准备

准备 1-2 个核心项目，能讲清楚：项目背景和目标、用的什么技术和方法、遇到什么问题怎么解决的、最后效果怎么样
如果有论文复现经历或者研究经历，准备好细节
开源贡献经历有的话也整理一下