本地AI编程助手来了:ggml-org推出llama-vscode插件

本地 AI 编程助手来了：ggml-org 推出 llama-vscode 插件

在云端大模型服务价格水涨船高、隐私问题日益突出的今天，越来越多的开发者开始关注本地部署的 AI 编程助手。近日，ggml-org（llama.cpp 官方组织）正式推出了 llama-vscode 插件——一个完全在本地运行的 LLM 辅助代码补全、聊天和智能编码扩展。

什么是 llama-vscode？

llama-vscode 是 ggml-org 推出的 VS Code 扩展，基于其著名的 llama.cpp(https://github.com/ggerganov/llama.cpp) 项目构建。它的核心理念很简单：让你的代码编辑器拥有本地 AI 能力，数据不出本机。

插件提供了三大核心功能：

基于 Fill-In-the-Middle 技术，插件会在你输入时实时给出代码建议。支持多种快捷操作：

内置聊天界面，可以直接与本地模型对话，无需联网。支持多轮交互，适合代码审查、架构讨论等场景。

这是最让人兴奋的功能——Agentic Coding。Llama Agent 可以：

llama-vscode 的一大亮点是对硬件的友好度。根据显存大小，推荐以下模型：

即使只有 CPU，也能运行 Qwen2.5-Coder-0.5B 或 1.5B 模型进行基础补全。

# macOSbrew install llama.cpp# Windowswinget install llama.cpp

从 VS Code 扩展市场(https://marketplace.visualstudio.com/items?itemName=ggml-org.llama-vscode) 搜索安装，或通过 Open VSX 获取。

点击状态栏的 llama-vscode 图标 → Select/start env，选择适合你硬件的配置即可开始使用。

llama-vscode 代表了 AI 编程工具的一个重要趋势——让强大的 AI 能力回归本地。对于重视数据安全的开发者来说，这是一个值得尝试的选择。即使你的硬件配置不高，也能通过选择合适的模型获得不错的编码辅助体验。

如果你受够了云端 API 的延迟、费用和隐私顾虑，不妨试试这个完全本地的解决方案。

📌 相关链接GitHub: ggml-org/llama.vscodeVS Code 市场: llama-vscodellama.cpp: github.com/ggerganov/llama.cpp