手把手教程 · 零成本部署个人AI助手
最近几个月,我把自己的一台本地迷你电脑上的AI助手迁移到了甲骨文云。整个过程踩了不少坑,也总结出了一套零成本、可复用的部署方案。今天把这个过程完整写出来,希望能帮到想跑自己AI Agent的朋友。
为什么选甲骨文云
市面上免费云服务器不少,但能跑AI Agent的只有甲骨文。
免费配置:4核 ARM + 24GB内存 + 200GB硬盘 + 每月10TB流量。这个配置跑Hermes Agent、Ollama本地模型、网关全开,绰绰有余。
对比:同样配置在AWS要$60+/月,在阿里云要¥300+/月。甲骨文免费送,而且绑定信用卡后基本不扣费。
限制:ARM实例需要抢(某些区域常年缺货),且闲置超过7天会被回收(有保活方案)。
选哪个区:首尔、东京、大阪、春川等亚洲区比较容易抢到ARM实例。
一、注册甲骨文云账号
访问 oracle.com/cloud/free,用 Google 或 Apple ID 注册。需要一张信用卡验证(Visa/Mastercard),扣1美元验证后返还。部分地区可能需要等待人工审核,快则几分钟,慢则1-2天。
二、创建ARM实例
1. 登录后进入控制台,左上角菜单选「计算」→「实例」
2. 点「创建实例」,镜像选 Ubuntu 22.04/24.04(推荐24.04),架构选 ARM
3. 规格选 VM.Standard.A1.Flex,CPU设4核,内存设24GB
4. SSH密钥:如果手头有现成的,上传公钥;没有的话点「保存私钥」下载
5. 网络:保留默认VCN,安全组需要放行SSH端口(22)和网关端口(可选)
6. 点创建,等待2-3分钟实例状态变绿色
三、基础环境配置
SSH登录后执行以下命令:
# 更新系统 sudo apt update && sudo apt upgrade -y # 安装基础工具 sudo apt install -y git curl wget python3 python3-pip # 安装Ollama(跑本地模型用,可选) curl -fsSL https://ollama.com/install.sh | sh # 限制Ollama CPU核心数(ARM无GPU,必须设) export OLLAMA_NUM_THREADS=4 # 拉取轻量模型(跑Hermes时作为fallback) ollama pull qwen2.5:3b
注意:ARM架构安装Python包时可能遇到编译问题,大部分常用包都有ARM预编译版本。如有问题可以加 --only-binary=:all: 解决。
四、安装Hermes Agent
Hermes Agent是一个开源的个人AI助手框架,支持多模型路由、消息网关、技能系统和定时任务。
# 克隆仓库 git clone https://github.com/NousResearch/hermes-agent.git cd hermes-agent # 安装依赖 pip install -r requirements.txt # 拷贝配置文件 cp config.example.yaml config.yaml
配置config.yaml,主要设置API密钥和模型路由。建议用DeepSeek作为主力模型(便宜且快),Ollama本地模型作为备份。
五、模型路由配置
这是Hermes的核心优势——多模型自动切换:
providers:
# 主力:DeepSeek(便宜、快、中文好)
deepseek:
api_key: "sk-你的key"
base_url: "https://api.deepseek.com"
# 备用:NVIDIA(免费额度)
nvidia:
api_key: "nvapi-你的key"
# 本地:Ollama(零成本、断网可用)
ollama:
api_key: "ollama"
base_url: "http://localhost:11434"
model_routing:
default_model: "deepseek/deepseek-chat"
fallback_order:
- "nvidia/llama-3.1-nemotron"
- "ollama/qwen2.5:3b"
配置好之后,Hermes会先调用DeepSeek,失败自动切换到NVIDIA,再失败切到本地Ollama,保证永不掉线。
六、配置消息网关(可选)
想让AI助手接入微信、飞书、Telegram,需要配置网关:
# 启动网关
hermes gateway start
# 然后在config.yaml中配置平台凭据
gateway:
platforms:
telegram:
bot_token: "你的token"
feishu:
app_id: "你的appid"
app_secret: "你的secret"
建议先只用Telegram练手,门槛最低。飞书需要企业认证,微信需要公众号。
安全提示:绝对不要开放公网端口暴露API。建议用Cloudflare Tunnel或Tailscale打通网络,或者只让网关从内部发起连接(反向连接模式)。
七、从本地迁移到云端
如果你已经在本地跑Hermes,迁移到云端只需要搬几个文件:
需要迁移的:
- config.yaml(API密钥和路由配置)
- skills/ 文件夹(你写的自定义技能)
- .env(环境变量,API密钥)
# 从本地打包 tar czf hermes_backup.tar.gz ~/.hermes/config.yaml ~/.hermes/.env ~/.hermes/skills/ # scp传到云端 scp hermes_backup.tar.gz ubuntu@你的云IP:~/ # 在云端解压到对应目录 tar xzf hermes_backup.tar.gz -C ~/.hermes/
不需要迁移的:history.db(会话历史,云端从零开始更干净)、logs/(旧日志)。Python环境和依赖直接在云端新装。
八、保活与运维(重要)
甲骨文免费ARM实例在闲置7天后会被自动回收。需要让实例保持活跃:
方案一:系统进程保活——让Hermes定时跑任务。配置cron例行任务,每天自动执行一次简报生成、日志清理等日常操作。有恒定的CPU使用率,甲骨文就不会回收。
方案二:SSH心跳——从另一台机器定时SSH连过来执行轻量命令。
磁盘清理:ARM实例的内存日志和模型缓存会逐渐占满空间。建议每周清理:删除旧日志文件、清理pip缓存、Ollama未使用的模型。
备份策略:config.yaml和skills文件夹每周自动备份一次。如果实例真被回收了,重建后几分钟就能恢复。
总结一下成本:
甲骨文ARM实例:免费
Hermes Agent:开源免费
主力模型(DeepSeek API):约 ¥1-3/百万token
每月总花费:约 ¥5-20(取决于使用量)
而作为对比,一个月的ChatGPT Plus就要¥140。自己部署的好处不只是省钱,更是完全掌控数据、自由定制、而且断网也能用。
我自己就是这样跑了大半年,从本地迷你电脑到甲骨文云,从单模型到多模型自动路由,从只能命令行到接入飞书和Telegram。这个号的这一篇内容,就是Hermes Agent帮我生成的。
下一篇我会写:如何用Ollama在甲骨文云上跑本地模型,以及为什么4核ARM能跑的模型比你想象的要多。
夜雨聆风