甲骨文云免费部署个人AI助手:Hermes Agent 完整教程

手把手教程 · 零成本部署个人AI助手

最近几个月，我把自己的一台本地迷你电脑上的AI助手迁移到了甲骨文云。整个过程踩了不少坑，也总结出了一套零成本、可复用的部署方案。今天把这个过程完整写出来，希望能帮到想跑自己AI Agent的朋友。

为什么选甲骨文云

市面上免费云服务器不少，但能跑AI Agent的只有甲骨文。

免费配置：4核 ARM + 24GB内存 + 200GB硬盘 + 每月10TB流量。这个配置跑Hermes Agent、Ollama本地模型、网关全开，绰绰有余。

对比：同样配置在AWS要$60+/月，在阿里云要¥300+/月。甲骨文免费送，而且绑定信用卡后基本不扣费。

限制：ARM实例需要抢（某些区域常年缺货），且闲置超过7天会被回收（有保活方案）。

选哪个区：首尔、东京、大阪、春川等亚洲区比较容易抢到ARM实例。

一、注册甲骨文云账号

访问 oracle.com/cloud/free，用 Google 或 Apple ID 注册。需要一张信用卡验证（Visa/Mastercard），扣1美元验证后返还。部分地区可能需要等待人工审核，快则几分钟，慢则1-2天。

二、创建ARM实例

1. 登录后进入控制台，左上角菜单选「计算」→「实例」

2. 点「创建实例」，镜像选 Ubuntu 22.04/24.04（推荐24.04），架构选 ARM

3. 规格选 VM.Standard.A1.Flex，CPU设4核，内存设24GB

4. SSH密钥：如果手头有现成的，上传公钥；没有的话点「保存私钥」下载

5. 网络：保留默认VCN，安全组需要放行SSH端口（22）和网关端口（可选）

6. 点创建，等待2-3分钟实例状态变绿色

三、基础环境配置

SSH登录后执行以下命令：

# 更新系统
sudo apt update && sudo apt upgrade -y

# 安装基础工具
sudo apt install -y git curl wget python3 python3-pip

# 安装Ollama（跑本地模型用，可选）
curl -fsSL https://ollama.com/install.sh | sh

# 限制Ollama CPU核心数（ARM无GPU，必须设）
export OLLAMA_NUM_THREADS=4

# 拉取轻量模型（跑Hermes时作为fallback）
ollama pull qwen2.5:3b

注意：ARM架构安装Python包时可能遇到编译问题，大部分常用包都有ARM预编译版本。如有问题可以加 --only-binary=:all: 解决。

四、安装Hermes Agent

Hermes Agent是一个开源的个人AI助手框架，支持多模型路由、消息网关、技能系统和定时任务。

# 克隆仓库
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent

# 安装依赖
pip install -r requirements.txt

# 拷贝配置文件
cp config.example.yaml config.yaml

配置config.yaml，主要设置API密钥和模型路由。建议用DeepSeek作为主力模型（便宜且快），Ollama本地模型作为备份。

五、模型路由配置

这是Hermes的核心优势——多模型自动切换：

providers:
  # 主力：DeepSeek（便宜、快、中文好）
  deepseek:
    api_key: "sk-你的key"
    base_url: "https://api.deepseek.com"

  # 备用：NVIDIA（免费额度）
  nvidia:
    api_key: "nvapi-你的key"

  # 本地：Ollama（零成本、断网可用）
  ollama:
    api_key: "ollama"
    base_url: "http://localhost:11434"

model_routing:
  default_model: "deepseek/deepseek-chat"
  fallback_order:
    - "nvidia/llama-3.1-nemotron"
    - "ollama/qwen2.5:3b"

配置好之后，Hermes会先调用DeepSeek，失败自动切换到NVIDIA，再失败切到本地Ollama，保证永不掉线。

六、配置消息网关（可选）

想让AI助手接入微信、飞书、Telegram，需要配置网关：

# 启动网关
hermes gateway start

# 然后在config.yaml中配置平台凭据
gateway:
  platforms:
    telegram:
      bot_token: "你的token"
    feishu:
      app_id: "你的appid"
      app_secret: "你的secret"

建议先只用Telegram练手，门槛最低。飞书需要企业认证，微信需要公众号。

安全提示：绝对不要开放公网端口暴露API。建议用Cloudflare Tunnel或Tailscale打通网络，或者只让网关从内部发起连接（反向连接模式）。

七、从本地迁移到云端

如果你已经在本地跑Hermes，迁移到云端只需要搬几个文件：

需要迁移的：

- config.yaml（API密钥和路由配置）

- skills/ 文件夹（你写的自定义技能）

- .env（环境变量，API密钥）

# 从本地打包
tar czf hermes_backup.tar.gz ~/.hermes/config.yaml   ~/.hermes/.env ~/.hermes/skills/

# scp传到云端
scp hermes_backup.tar.gz ubuntu@你的云IP:~/

# 在云端解压到对应目录
tar xzf hermes_backup.tar.gz -C ~/.hermes/

不需要迁移的：history.db（会话历史，云端从零开始更干净）、logs/（旧日志）。Python环境和依赖直接在云端新装。

八、保活与运维（重要）

甲骨文免费ARM实例在闲置7天后会被自动回收。需要让实例保持活跃：

方案一：系统进程保活——让Hermes定时跑任务。配置cron例行任务，每天自动执行一次简报生成、日志清理等日常操作。有恒定的CPU使用率，甲骨文就不会回收。

方案二：SSH心跳——从另一台机器定时SSH连过来执行轻量命令。

磁盘清理：ARM实例的内存日志和模型缓存会逐渐占满空间。建议每周清理：删除旧日志文件、清理pip缓存、Ollama未使用的模型。

备份策略：config.yaml和skills文件夹每周自动备份一次。如果实例真被回收了，重建后几分钟就能恢复。

总结一下成本：

甲骨文ARM实例：免费

Hermes Agent：开源免费

主力模型（DeepSeek API）：约 ¥1-3/百万token

每月总花费：约 ¥5-20（取决于使用量）

而作为对比，一个月的ChatGPT Plus就要¥140。自己部署的好处不只是省钱，更是完全掌控数据、自由定制、而且断网也能用。

我自己就是这样跑了大半年，从本地迷你电脑到甲骨文云，从单模型到多模型自动路由，从只能命令行到接入飞书和Telegram。这个号的这一篇内容，就是Hermes Agent帮我生成的。

下一篇我会写：如何用Ollama在甲骨文云上跑本地模型，以及为什么4核ARM能跑的模型比你想象的要多。