青岛实习|AI 与软件开发实习生岗位|170-220 元/天
✨职位信息概览
歌尔股份(Goertek)招3个月AI 与软件开发实习生岗位,170-220 元/天,工作地址:青岛崂山区歌尔研发大楼,面向硕士及以上学历在读毕业生
📋岗位职责
-
参与图像处理、计算机视觉、机器学习相关算法研发与实现; -
负责 AI 模型调研、微调、训练迭代与效果优化; -
协助 AI ISP 算法调试、画质评测与数据分析; -
使用 AI 辅助编程工具进行脚本开发、自动化测试与工程化部署; -
与算法、开发、测试团队协同对接需求、解决问题,完成算法与项目相关文档编写。
✅任职要求
-
全日制硕士在读,电子信息、计算机、自动化、软件工程、人工智能等相关专业; -
熟悉 C/C++、Python 等编程语言,具备扎实的编程基础; -
了解深度学习原理与常用网络结构,熟悉 PyTorch / TensorFlow 等至少一种深度学习框架; -
熟悉图像处理、计算机视觉、ISP 流程等基础理论与算法; -
学习能力强,踏实严谨,具备良好的沟通协作与问题解决能力。
加分项:
-
有模型量化、剪枝、部署经验,熟悉 TensorRT 等推理框架; -
有 OpenCV 开发经验或图像/视频相关项目、竞赛经历; -
在会议/期刊上发表过论文,相关比赛获奖,及持有相关专利者优先。
📸招聘详情

💡应聘技术问题
问题:”请解释卷积神经网络中感受野的概念,以及如何增大感受野?”
参考答案:
感受野(Receptive Field)是输出特征图上一个像素对应到原始输入图像的区域大小,简单说就是网络这一层能”看到”多大范围的信息。
几种常用的扩大方式:
-
堆叠卷积层:两个 3×3 卷积叠起来的感受野等于一个 5×5,但参数更少。 -
池化或步长 > 1 的卷积:下采样之后,后面的层每一点对应的输入区域会变大。 -
空洞卷积(Dilated Convolution):卷积核元素之间插入空洞,不增加参数就能扩大覆盖范围,语义分割里用得很多。
问题:”ISP 流水线中常见的处理模块有哪些?各自的作用是什么?”
参考答案:
ISP 把传感器输出的 RAW 数据处理成能看的图像,主要模块按处理顺序大致有:
-
黑电平校正(BLC):去掉传感器暗电流带来的偏移,让暗场景下信号归零。 -
镜头阴影校正(LSC):镜头边缘会偏暗、偏色,这个模块做补偿。 -
坏点校正(DPC):修掉传感器上的死像素。 -
去马赛克(Demosaic):Bayer 格式的 RAW 是单通道的,需要插值出 RGB 三通道。 -
白平衡(AWB):根据光源调整 R/G/B 增益,让白色在画面里真的是白色。 -
色彩校正矩阵(CCM):把传感器的色彩空间转到 sRGB 这类标准空间。 -
伽马校正(Gamma):做非线性亮度映射,匹配人眼的感知特性。 -
降噪(NR):去掉高 ISO 或暗光下的噪点。 -
边缘增强(EE):提升清晰度,一般放在降噪后面。 -
色调映射(Tone Mapping):HDR 场景里压缩动态范围,同时保留亮部和暗部细节。
问题:”什么是模型量化?INT8 量化相比 FP32 会带来哪些影响?如何减少精度损失?”
参考答案:
量化就是把模型里的 FP32 权重和激活值转成低比特整数(比如 INT8),好处是模型变小、显存占用降低、推理变快。在支持 INT8 的硬件上(TensorRT、移动端 NPU),速度通常能快 2-4 倍。
代价是精度会掉:数值范围和分辨率都变小了,分布特别广或者有离群值的张量受影响比较大。
减少精度损失的办法:
-
校准(Calibration):拿一批有代表性的数据跑一遍,统计每层激活值的实际分布,据此确定 scale 和 zero-point。比直接用全局 min/max 效果好。 -
对称量化 vs 非对称量化:看数据分布选合适的。 -
逐通道量化(Per-channel):权重按输出通道分别算量化参数,比逐张量精度高。 -
混合精度:量化后掉分明显的层保留 FP16/FP32,其他层用 INT8。 -
量化感知训练(QAT):训练时就模拟量化,让模型提前适应低精度。一般比训练后量化(PTQ)精度更高,但需要重新训练。
问题:”描述一个你参与过的图像处理或深度学习项目,你在其中负责什么?遇到了什么挑战?”
参考答案:
这类题没有标准答案,但面试官想看的是你做事的思路,不是背出来的流程。按 STAR 结构组织会比较清楚:
Situation(背景): 项目是干什么的,业务需求是什么。比如”团队要做一个工业缺陷检测系统,要求在嵌入式设备上实时跑”。
Task(任务): 你负责哪一块。比如”我负责检测模型的训练调优和压缩部署”。
Action(行动): 具体怎么做的。比如”我用 YOLOv8 做检测,小目标缺陷识别不好,就调大了输入分辨率并改了多尺度特征融合;部署端用 TensorRT 做 INT8 量化,配合校准数据集调参”。
Result(结果): 最后效果怎么样。比如”测试集 mAP 94.5%,INT8 量化后精度掉了不到 1%,推理从 45ms 降到 12ms,满足了产线要求”。
回答的关键是讲清楚为什么这么选、遇到问题怎么分析的,别光列”我做了什么”。
问题:”如果 AI ISP 算法在低光照场景下画质明显下降,你会如何排查和优化?”
参考答案:
按模块逐层排查:
1. 先看数据:
-
查低光照下 RAW 的信噪比,看噪声是不是已经超出了预期。 -
把正常光照和低光照的 RAW 数据分布拉出来对比,看有没有异常截断或者饱和。
2. 逐个模块排查:
-
降噪(NR):暗光下噪声本来就大,降噪不够会留噪点,降过了细节全没了。可能需要调参数或者换深度学习降噪方案。 -
白平衡(AWB):低色温光源下容易失效,看看 R/B 通道增益对不对。 -
伽马和色调映射:暗区拉伸不够的话细节就丢了,检查 gamma 曲线和 tone mapping 参数。 -
黑电平校正:BLC 不准的话暗区会偏色、出色块。
3. AI 模型层面:
-
看训练数据里低光照样本够不够,不够就加数据增强或者多采集。 -
观察模型在低光照输入下的特征图,看有没有特征退化。 -
可以试试加光照感知的条件输入,让模型根据场景亮度自动调整策略。
4. 端到端方案的话:
-
在 loss 里给暗区加权重,让模型更在意低光照区域的质量。
🎯应聘面试准备
问:想应聘上述岗位,需要做哪些准备?
答:
简历优化
1.核心信息前置
-
学历背景:全日制硕士在读,电子信息、计算机、自动化、软件工程、人工智能等相关专业 -
项目经历:把实验室课题、校企合作或个人开源项目里跟 CV/深度学习相关的经历往前放 -
技术栈:C/C++、Python、PyTorch/TensorFlow、OpenCV -
意向岗位:AI 算法工程师 / 计算机视觉工程师(实习方向)
2.匹配岗位关键词
-
技术栈:C/C++、Python、PyTorch、TensorFlow、TensorRT、OpenCV -
工程能力:模型训练与微调、模型量化与部署、自动化测试、脚本开发 -
工具与平台:Git、Linux、CUDA、TensorRT -
能力标签:图像处理、计算机视觉、ISP、深度学习、AI ISP
技能梳理
编程基础(C/C++ & Python):
-
指针、内存管理、STL 容器这些 C++ 基础要能讲清楚 -
NumPy、OpenCV-Python 的常用操作要熟练 -
了解一下 C++ 调 Python 模型的混合编程(比如 pybind11)
深度学习基础:
-
CNN 基本组成:卷积、池化、BN、激活函数、感受野怎么算 -
常见网络:ResNet、MobileNet、YOLO 系列、UNet -
训练技巧:学习率调度、数据增强、正则化、loss 怎么选 -
能用 PyTorch 自己搭一个视觉模型跑通训练和验证
计算机视觉与图像处理:
-
传统图像处理:滤波、边缘检测、直方图、色彩空间转换 -
常见任务:目标检测、语义分割、图像分类的常用方案 -
ISP 基本流程:RAW → Demosaic → AWB → CCM → Gamma → NR → EE
模型部署与优化(加分方向):
-
TensorRT 基本流程:ONNX → Engine → 推理 -
量化原理(FP32 → INT8)和校准方法 -
模型剪枝、知识蒸馏的思路
面试准备
经典问题
-
感受野怎么算?1×1 卷积有什么用? -
BN 的原理,训练和推理阶段有什么区别? -
过拟合怎么看出来?常用的正则化有哪些?
系统设计
-
工业缺陷检测系统怎么设计?从数据采集到部署的完整链路 -
PyTorch 训练的视觉模型怎么部署到嵌入式设备?要考虑什么? -
AI ISP 和传统 ISP 各有什么优劣?目前 AI ISP 的主要难点在哪?
项目经验准备
-
准备 1-2 个核心项目,能讲清楚:项目背景和目标、用的什么技术和方法、遇到什么问题怎么解决的、最后效果怎么样 -
如果有论文复现经历或者研究经历,准备好细节 -
开源贡献经历有的话也整理一下
夜雨聆风