乐于分享
好东西不私藏

青岛实习|AI 与软件开发实习生岗位|170-220 元/天

青岛实习|AI 与软件开发实习生岗位|170-220 元/天

✨职位信息概览

歌尔股份(Goertek)招3个月AI 与软件开发实习生岗位,170-220 元/天,工作地址:青岛崂山区歌尔研发大楼,面向硕士及以上学历在读毕业生

📋岗位职责

  1. 参与图像处理、计算机视觉、机器学习相关算法研发与实现;
  2. 负责 AI 模型调研、微调、训练迭代与效果优化;
  3. 协助 AI ISP 算法调试、画质评测与数据分析;
  4. 使用 AI 辅助编程工具进行脚本开发、自动化测试与工程化部署;
  5. 与算法、开发、测试团队协同对接需求、解决问题,完成算法与项目相关文档编写。

✅任职要求

  1. 全日制硕士在读,电子信息、计算机、自动化、软件工程、人工智能等相关专业;
  2. 熟悉 C/C++、Python 等编程语言,具备扎实的编程基础;
  3. 了解深度学习原理与常用网络结构,熟悉 PyTorch / TensorFlow 等至少一种深度学习框架;
  4. 熟悉图像处理、计算机视觉、ISP 流程等基础理论与算法;
  5. 学习能力强,踏实严谨,具备良好的沟通协作与问题解决能力。

加分项:

  • 有模型量化、剪枝、部署经验,熟悉 TensorRT 等推理框架;
  • 有 OpenCV 开发经验或图像/视频相关项目、竞赛经历;
  • 在会议/期刊上发表过论文,相关比赛获奖,及持有相关专利者优先。

📸招聘详情

💡应聘技术问题

问题:”请解释卷积神经网络中感受野的概念,以及如何增大感受野?”

参考答案:

感受野(Receptive Field)是输出特征图上一个像素对应到原始输入图像的区域大小,简单说就是网络这一层能”看到”多大范围的信息。

几种常用的扩大方式:

  • 堆叠卷积层:两个 3×3 卷积叠起来的感受野等于一个 5×5,但参数更少。
  • 池化或步长 > 1 的卷积:下采样之后,后面的层每一点对应的输入区域会变大。
  • 空洞卷积(Dilated Convolution):卷积核元素之间插入空洞,不增加参数就能扩大覆盖范围,语义分割里用得很多。

问题:”ISP 流水线中常见的处理模块有哪些?各自的作用是什么?”

参考答案:

ISP 把传感器输出的 RAW 数据处理成能看的图像,主要模块按处理顺序大致有:

  • 黑电平校正(BLC):去掉传感器暗电流带来的偏移,让暗场景下信号归零。
  • 镜头阴影校正(LSC):镜头边缘会偏暗、偏色,这个模块做补偿。
  • 坏点校正(DPC):修掉传感器上的死像素。
  • 去马赛克(Demosaic):Bayer 格式的 RAW 是单通道的,需要插值出 RGB 三通道。
  • 白平衡(AWB):根据光源调整 R/G/B 增益,让白色在画面里真的是白色。
  • 色彩校正矩阵(CCM):把传感器的色彩空间转到 sRGB 这类标准空间。
  • 伽马校正(Gamma):做非线性亮度映射,匹配人眼的感知特性。
  • 降噪(NR):去掉高 ISO 或暗光下的噪点。
  • 边缘增强(EE):提升清晰度,一般放在降噪后面。
  • 色调映射(Tone Mapping):HDR 场景里压缩动态范围,同时保留亮部和暗部细节。

问题:”什么是模型量化?INT8 量化相比 FP32 会带来哪些影响?如何减少精度损失?”

参考答案:

量化就是把模型里的 FP32 权重和激活值转成低比特整数(比如 INT8),好处是模型变小、显存占用降低、推理变快。在支持 INT8 的硬件上(TensorRT、移动端 NPU),速度通常能快 2-4 倍。

代价是精度会掉:数值范围和分辨率都变小了,分布特别广或者有离群值的张量受影响比较大。

减少精度损失的办法:

  • 校准(Calibration):拿一批有代表性的数据跑一遍,统计每层激活值的实际分布,据此确定 scale 和 zero-point。比直接用全局 min/max 效果好。
  • 对称量化 vs 非对称量化:看数据分布选合适的。
  • 逐通道量化(Per-channel):权重按输出通道分别算量化参数,比逐张量精度高。
  • 混合精度:量化后掉分明显的层保留 FP16/FP32,其他层用 INT8。
  • 量化感知训练(QAT):训练时就模拟量化,让模型提前适应低精度。一般比训练后量化(PTQ)精度更高,但需要重新训练。

问题:”描述一个你参与过的图像处理或深度学习项目,你在其中负责什么?遇到了什么挑战?”

参考答案:

这类题没有标准答案,但面试官想看的是你做事的思路,不是背出来的流程。按 STAR 结构组织会比较清楚:

Situation(背景): 项目是干什么的,业务需求是什么。比如”团队要做一个工业缺陷检测系统,要求在嵌入式设备上实时跑”。

Task(任务): 你负责哪一块。比如”我负责检测模型的训练调优和压缩部署”。

Action(行动): 具体怎么做的。比如”我用 YOLOv8 做检测,小目标缺陷识别不好,就调大了输入分辨率并改了多尺度特征融合;部署端用 TensorRT 做 INT8 量化,配合校准数据集调参”。

Result(结果): 最后效果怎么样。比如”测试集 mAP 94.5%,INT8 量化后精度掉了不到 1%,推理从 45ms 降到 12ms,满足了产线要求”。

回答的关键是讲清楚为什么这么选、遇到问题怎么分析的,别光列”我做了什么”。

问题:”如果 AI ISP 算法在低光照场景下画质明显下降,你会如何排查和优化?”

参考答案:

按模块逐层排查:

1. 先看数据:

  • 查低光照下 RAW 的信噪比,看噪声是不是已经超出了预期。
  • 把正常光照和低光照的 RAW 数据分布拉出来对比,看有没有异常截断或者饱和。

2. 逐个模块排查:

  • 降噪(NR):暗光下噪声本来就大,降噪不够会留噪点,降过了细节全没了。可能需要调参数或者换深度学习降噪方案。
  • 白平衡(AWB):低色温光源下容易失效,看看 R/B 通道增益对不对。
  • 伽马和色调映射:暗区拉伸不够的话细节就丢了,检查 gamma 曲线和 tone mapping 参数。
  • 黑电平校正:BLC 不准的话暗区会偏色、出色块。

3. AI 模型层面:

  • 看训练数据里低光照样本够不够,不够就加数据增强或者多采集。
  • 观察模型在低光照输入下的特征图,看有没有特征退化。
  • 可以试试加光照感知的条件输入,让模型根据场景亮度自动调整策略。

4. 端到端方案的话:

  • 在 loss 里给暗区加权重,让模型更在意低光照区域的质量。

🎯应聘面试准备

问:想应聘上述岗位,需要做哪些准备?

答:

简历优化

1.核心信息前置

  • 学历背景:全日制硕士在读,电子信息、计算机、自动化、软件工程、人工智能等相关专业
  • 项目经历:把实验室课题、校企合作或个人开源项目里跟 CV/深度学习相关的经历往前放
  • 技术栈:C/C++、Python、PyTorch/TensorFlow、OpenCV
  • 意向岗位:AI 算法工程师 / 计算机视觉工程师(实习方向)

2.匹配岗位关键词

  • 技术栈:C/C++、Python、PyTorch、TensorFlow、TensorRT、OpenCV
  • 工程能力:模型训练与微调、模型量化与部署、自动化测试、脚本开发
  • 工具与平台:Git、Linux、CUDA、TensorRT
  • 能力标签:图像处理、计算机视觉、ISP、深度学习、AI ISP

技能梳理

编程基础(C/C++ & Python):

  • 指针、内存管理、STL 容器这些 C++ 基础要能讲清楚
  • NumPy、OpenCV-Python 的常用操作要熟练
  • 了解一下 C++ 调 Python 模型的混合编程(比如 pybind11)

深度学习基础:

  • CNN 基本组成:卷积、池化、BN、激活函数、感受野怎么算
  • 常见网络:ResNet、MobileNet、YOLO 系列、UNet
  • 训练技巧:学习率调度、数据增强、正则化、loss 怎么选
  • 能用 PyTorch 自己搭一个视觉模型跑通训练和验证

计算机视觉与图像处理:

  • 传统图像处理:滤波、边缘检测、直方图、色彩空间转换
  • 常见任务:目标检测、语义分割、图像分类的常用方案
  • ISP 基本流程:RAW → Demosaic → AWB → CCM → Gamma → NR → EE

模型部署与优化(加分方向):

  • TensorRT 基本流程:ONNX → Engine → 推理
  • 量化原理(FP32 → INT8)和校准方法
  • 模型剪枝、知识蒸馏的思路

面试准备

经典问题

  • 感受野怎么算?1×1 卷积有什么用?
  • BN 的原理,训练和推理阶段有什么区别?
  • 过拟合怎么看出来?常用的正则化有哪些?

系统设计

  • 工业缺陷检测系统怎么设计?从数据采集到部署的完整链路
  • PyTorch 训练的视觉模型怎么部署到嵌入式设备?要考虑什么?
  • AI ISP 和传统 ISP 各有什么优劣?目前 AI ISP 的主要难点在哪?

项目经验准备

  • 准备 1-2 个核心项目,能讲清楚:项目背景和目标、用的什么技术和方法、遇到什么问题怎么解决的、最后效果怎么样
  • 如果有论文复现经历或者研究经历,准备好细节
  • 开源贡献经历有的话也整理一下