乐于分享
好东西不私藏

AI每天生成10亿行代码,但谁来保证这些代码是安全的?

AI每天生成10亿行代码,但谁来保证这些代码是安全的?

一个让所有程序员脊背发凉的数据:

2026年,AI工具每天在全球生成超过10亿行新代码。这个数字,在2024年还几乎为零。

代码大爆炸了。

但问题来了——这些代码,谁来审查?

你可能说:程序员自己啊。但问题是,全世界的程序员数量并没有增长10倍。代码增量爆炸,质量却没有对应的保障机制。

更可怕的是,AI生成的代码里,有相当比例存在安全隐患、逻辑漏洞或者直接就是Bug。代码评审(Code Review)团队已经严重超负荷。

这就是Gitar看到的机会。


这家公司,用AI来守护AI生成的代码

Gitar,4月15日从”隐身模式”走出来,宣布完成900万美元种子轮融资,由Venrock领投,Sierra Ventures跟投。

创始团队阵容很豪华:

  • Ali-Reza Adl-Tabatabai(CEO):Intel Labs出身、Google、Uber背景,妥妥的顶级技术履历
  • 公司目前只有两年历史,总部在加州圣马特奥

Gitar在做什么?一句话概括:用AI Agent来审查AI生成的代码。

具体来说,Gitar的平台会部署AI Agent,自动执行以下任务:

  1. 代码审查(Code Review)——检查AI生成的代码有没有Bug、风格问题、安全隐患
  2. CI/CD流水线管理——自动化测试、持续集成、诊断CI失败原因
  3. 安全扫描——识别潜在的代码注入、权限问题、凭证泄露
  4. 自定义Agent构建——企业团队可以训练自己的专属Agent来执行特定安全维护任务

Gitar的CEO Adl-Tabatabai说得特别直接:

“AI生成代码意味着更多的代码需要审查、更多的测试需要写、更多的CI失败需要诊断。Generation负责产出,Validation负责可信。Gitar就是那个负责Validation的工作流Agent。

这句话很关键——**Gitar不生成代码,它只负责验证代码。**在AI编程这个已经相当拥挤的赛道里,它选择了最薄、但也最不可或缺的一环。


代码过载:Vibe Coding的副产品来了

要理解Gitar为什么现在出现,你必须理解一个正在硅谷流行的新词——Code Overload(代码过载)

《纽约时报》今年4月专门写了一篇报道,标题就叫《AI代码过载》。文章描述了一个正在全球各大科技公司蔓延的困境:

  • 开发者用Cursor、Claude Code、Copilot等工具,每天能产出比以前多5到10倍的代码
  • 但这些代码的质量参差不齐,很多需要高级工程师介入才能判断是否可用
  • 高级工程师的数量没有增加,他们的瓶颈反而更堵了
  • 整个软件交付周期不是变快了,而是在某些环节变得更慢了

这就是”代码过载”。AI让写代码变得极其容易,但让代码变得可信,依然需要人

Gitar的赌注是:未来,人工介入代码审查将成为”例外情况”,而不是”标准流程”。他们的Validation Agent会自动确保代码”可以安全发布”,只有遇到真正复杂的异常情况才需要人工介入。

这听起来很激进。但Adl-Tabatabai认为这是必然趋势:

“现在,发布到生产环境的代码都需要人工审查,这有充分的理由——你需要确保没有糟糕的东西被发布。但我们的愿景是,Validation Agent能自动处理这些工作,人只在例外情况下才出现。”


安全漏洞:AI代码本身可能被”投毒”

代码过载只是问题的一方面。更危险的是——AI代码本身可能成为攻击载体。

安全研究人员最近发现了一个令人不寒而栗的攻击模式,命名为**”Comment and Control”(评论即控制)**攻击:

  • 攻击者在GitHub的PR标题、Issue描述、甚至代码注释里植入恶意指令
  • AI代码审查工具(如Claude Code Security Review)会自动读取这些内容
  • 恶意指令触发AI执行任意命令——包括扫描并外传代码库里的所有密钥和凭证

这个攻击对Claude Code Security Review、Gemini CLI Action、GitHub Copilot Agent三个主流工具全部有效

更可怕的是:攻击者只需要在PR标题里埋一句话。整个过程不需要受害者任何操作,GitHub Actions自动触发。

安全研究人员将这个问题报告给三家厂商后:

  • Anthropic将其定性为”严重”漏洞,颁发$100赏金
  • Google颁发$1,337赏金
  • GitHub只给了$500,并表示这是”已知的架构局限”

GitHub的态度很说明问题——它的意思很明确:这个问题从架构层面无法根本解决,只能缓解。

为什么?因为AI Agent的设计逻辑本身就是”处理所有输入为上下文”。而只要有输入,就有可能被注入恶意指令。

这不是一个Bug。这是AI Agent的”原罪”。


Gitar的机会在哪里?

在这样的背景下,Gitar的出现就有了特殊的战略意义。

现在市面上做代码审查的工具有很多,但大多数是给人类工程师用的——静态分析工具、linters、人工代码评审流程。

Gitar的不同之处在于:它的整个工作流都是为AI原生代码设计的

  • 它知道AI生成的代码有什么常见问题模式
  • 它的Agent可以自动化整个审查-测试-诊断链条
  • 它面向的是企业级团队,帮助他们建立”AI代码质量管控”的标准流程

这个定位其实很聪明。AI编程赛道已经卷成红海了——Cursor融了几十亿美元,Claude Code成了开发者标配,Copilot用户过亿。但在”代码审控”这个环节,依然是蓝海。


对开发者来说意味着什么?

如果你是一个开发者,或者正在用AI工具写代码,Gitar的出现至少提醒了你几件事:

第一,AI生成的代码,不要直接用。 必须经过审查,哪怕是AI自己审查自己。

第二,”代码能跑”不等于”代码没问题”。 AI生成的代码往往在逻辑上看起来没问题,但在安全性、边界条件、异常处理上存在大量漏洞。

第三,prompt injection攻击正在变得越来越普遍和危险。 你的AI编程工具,可能正在成为攻击者的入口。


写在最后

Gitar的故事,其实是一个关于”AI成功带来的新问题”的故事。

AI编程工具大获成功——Cursor百亿估值、Claude Code改变了几百万开发者的日常、GitHub Copilot成了程序员的标配。但没有人想过:当所有人都开始高速生产代码的时候,谁来保证这些代码的质量?

Gitar是这个问题的答案之一。

它融资900万美元,对比Cursor的50亿美元估值,显得很小。但它的存在本身,揭示了一个更大的趋势:

AI编程的上半场,是让写代码变得更快。
AI编程的下半场,是让代码变得可信。

谁能解决”可信”这个问题,谁就拿到了下半场真正的门票。

Gitar,已经出牌了。


相关链接:

  • TechCrunch报道:https://techcrunch.com/2026/04/15/gitar-a-startup-that-uses-agents-to-secure-code-emerges-from-stealth-with-9-million/[1]
  • SecurityWeek安全分析:https://www.securityweek.com/claude-code-gemini-cli-github-copilot-agents-vulnerable-to-prompt-injection-via-comments/[2]
  • 研究人员原始报告:https://oddguan.com/blog/comment-and-control-prompt-injection-credential-theft-claude-code-gemini-cli-github-copilot/[3]

引用链接

[1]https://techcrunch.com/2026/04/15/gitar-a-startup-that-uses-agents-to-secure-code-emerges-from-stealth-with-9-million/

[2]https://www.securityweek.com/claude-code-gemini-cli-github-copilot-agents-vulnerable-to-prompt-injection-via-comments/

[3]https://oddguan.com/blog/comment-and-control-prompt-injection-credential-theft-claude-code-gemini-cli-github-copilot/