Hermes Agent v0.17.0 (v2026.6.19) 正式发布文档
发布负责人:@teknium1 | 发布日期:2026年6月19日 | 版本代号:The Reach Release
一、发布概览
迭代规模(自 v0.16.0 起)
- 代码提交:约 1,475 次
- 合并 PR:约 800 个
- 文件变更:1,693 个
- 代码新增:235,390 行
- 代码删除:50,730 行
- 关闭社区 Issue:300+
- 社区贡献者:245 位
v0.16.0 完成了 Hermes 桌面端的正式落地,v0.17.0 则全面延伸能力边界——拓展对话接入渠道、深度集成日常生产工具、面向团队与企业部署强化管控与运维能力。本版本新增 iMessage、Raft 代理网络两大原生接入渠道,桌面客户端从预览级升级为生产级生产力工具,子代理支持后台异步运行,图像生成工具新增图生图编辑能力,同时打通 xAI Grok 订阅直接调用 Cursor Composer 编码模型;仪表盘实现零配置文件的可视化档案构建,技能中心全面重构,内存工具升级原子化批量操作,技能管理器默认关闭辅助模型开销,大幅降低日常运行的 Token 成本。
二、核心功能亮点
1. 原生接入 iMessage,无需 Mac 中继
基于 Photon Spectrum 托管线路池打造官方 iMessage 平台插件,用户仅需执行 hermes photon login 通过设备码完成认证,即可让 Hermes 直接收发 iMessage 消息。彻底摆脱 Mac 设备中继、BlueBubbles 桥接服务的运维成本,定位为 BlueBubbles 的替代方案,开箱即用、无需自建服务。
2. 接入 Raft 代理网络
新增内置 Raft 平台适配器,支持 Hermes 作为外部代理通过唤醒通道桥接接入 Raft 网络。采用合约级隐私设计,唤醒载荷仅携带事件ID、时间戳等元数据,永不传输消息正文,在保障隐私的前提下拓展 Hermes 的工作触达场景。
3. 桌面端能力全面生产化
桌面应用迎来数十项功能升级:支持自定义键盘快捷键、分类型原生系统通知、子代理实时活动监视面板、模型选择器与单模型预设、自动RTL/双向文本适配、可缩放VS Code风格终端、单线程草稿保存,支持直接安装任意 VS Code Marketplace 主题,从预览版本升级为可日常重度使用的生产级客户端。
4. 后台异步子代理,任务委托不阻塞
delegate_task(background=true) 支持调度子代理在后台独立运行,调用后立即返回句柄,主会话可继续执行其他任务。子代理完成后结果会自动作为新回合汇入对话,适合长周期调研、多步骤构建等耗时任务,彻底消除等待阻塞。
5. 图像工具支持编辑与图生图
image_generate 工具新增图生图编辑能力,支持传入原图+提示词调用后端编辑接口,覆盖所有已支持的图像提供商。改色、去背景、草图转渲染等需求均可通过原有工具直接完成,与视频生成工具保持一致的调用模式。
6. 自动化蓝图:零 Cron 语法配置定时任务
提供命名化自动化模板,Hermes 会通过对话引导用户填写所需参数,无需记忆 Cron 语法、无需手动输入键值对。同一份蓝图可在仪表盘表单、CLI/TUI/聊天端斜杠命令、对话交互、文档目录等全端原生渲染,配置定时任务仅需回答引导问题。
7. 打通 xAI 订阅调用 Cursor Composer 模型
xAI OAuth 模型选择器新增 grok-composer-2.5-fast,完整对齐200k上下文窗口。持有 xAI Grok 订阅的用户无需单独申请API密钥,可直接通过OAuth授权让 Hermes 代理循环调用 Cursor 背后的高速编码模型。
8. 仪表盘完整可视化档案构建
支持在浏览器端完整搭建 Hermes 配置档案:选择模型、配置技能、挂载MCP服务器,全程无需手动编辑 config.yaml。同时统一多档案管理入口,提供全局档案切换器,单视图即可管理本机所有配置档案。
9. 技能中心浏览器全面重构
仪表盘技能中心从底层重做:支持多枢纽联动、新增精选专区、安装前可完整预览技能内容、每个技能附带安全扫描。浏览安装 OpenAI、Anthropic、HuggingFace、NVIDIA 等可信源技能的体验从纯列表升级为完整的浏览交互。
10. 内存工具原子化批量操作升级
内存工具新增操作数组接口,可在单次调用中原子化执行添加/替换/删除批量编辑,自动适配最终字符预算。即使新增内容会超出容量,也可在同一次调用中完成空间释放与内容写入,将原本脆弱的多回合编辑流程收敛为单次可靠操作,大幅降低内存更新失败率。
11. 仪表盘安全登录加固
全面强化仪表盘鉴权:所有需要令牌的接口在OAuth网关后统一正确返回401状态码,WebSocket鉴权复用仪表盘令牌,公共URL覆盖配置被静默拒绝时触发警告。默认暴露仪表盘到网络时的安全性显著提升。
12. 官方 WhatsApp Business Cloud API 适配
在原有 Baileys 桥接方案之外,新增 Meta 官方 WhatsApp Business Cloud API 适配器。直接对接官方托管通道,无需维持扫码桥接进程,配置业务API凭证即可接入。
13. Telegram 原生富文本渲染
适配 Bot API 10.1,回复消息默认采用原生富消息格式,优化排版效果与长消息展示,使用原生标记替代扁平化文本。功能默认开启,支持手动关闭,无需额外配置即可获得标准聊天体验。
14. 技能管理器成本优化,零辅助模型开销
技能管理器默认保留过期技能清理逻辑,但关闭LLM驱动的技能合并流程,仅在用户主动开启(配置 curator.consolidate: true 或命令加 --consolidate 参数)时执行。常规后台运维不再消耗辅助模型Token,日常运行零额外成本。
三、分模块详细更新
3.1 桌面应用
交互与体验升级
- 自定义快捷键面板、分类型系统通知开关、回合完成提示与可关闭错误横幅
- 子代理实时监视窗口、编辑器状态栈与可编辑提示、支持单聊独立窗口、紧凑窗口新建会话快捷键
- 模型选择器支持单模型预设、外部提供商断开提示,统一模型数据源,主模型切换时提示辅助任务模型不匹配
- 支持安装VS Code市场主题、单档案独立主题配置、窗口透明度调节、统一设计系统与全新引导流程
- 可缩放VS Code风格终端、自动识别双向文本、Mac风格会话切换快捷键、工作树侧边栏分组、悬停展开折叠侧边栏
- 编辑器支持方向键浏览历史与队列编辑、审批栏内联展开命令、自动滚动到底部、侧边栏原生支持定时任务
- 新增桌面宠物悬浮层与通知、完整工具后端可视化配置、支持图形化执行工具后端安装、可单独卸载聊天界面
- 新增日语、繁体中文语言切换,状态栏新增网关重启操作,日志支持选中复制
远程网关与多档案
- 远程媒体中继:支持网络环境下上传附件、展示代理生成的图片与文件
- 客户端与后端版本显示、远程后端更新引导、远程文件浏览、睡眠唤醒后自动重连恢复会话
- 多档案权限隔离:WebSocket鉴权、跨档案会话读取限制、删除前释放后端资源、会话列表与模型切换按会话隔离
- 子代理活动流支持监视窗口、后台窗口持续渲染流、异常会话窗口自动恢复
3.2 Web 仪表盘
- 全功能档案构建器(模型+技能+MCP配置),统一多档案管理视图与全局切换器,会话切换面板集成到聊天页
- 技能中心重构:多枢纽接入、精选专区、预览与安全扫描、技能文件编辑器、定时任务支持技能选择、MCP详情页
- 支持页面内直接启用Webhook、幂等式仪表盘注册、Telegram扫码引导后自动重启网关、文件浏览器、主题切换字体、聊天侧边栏推理强度选择
3.3 核心代理与架构
代码架构重构
cli.py主函数从3297行精简至954行,拆分28个子命令解析器、32个斜杠命令、18个模型配置流程到独立模块gateway/run.py从19157行精简至15870行,拆分斜杠命令、鉴权、看板监视到独立混入类- 代理回合循环拆分上下文初始化、回合收尾、重试状态管理到独立模块
代理循环与工具
- 内存原子批量操作、文件搜索无损压缩优化、移除代理可调用的消息发送工具、编码上下文全端对齐
- 上下文文件可配置截断阈值与警告、按模型窗口自动适配容量、提示代理文件已截断
- 摘要压缩新增时间锚点、GPT-5.5触发阈值上调至85%、自适应中间件支持遥测与回合中引导
模型与提供商
- 新增支持 glm-5.2、claude-fable-5、laguna-m.1、nemotron-3-ultra、xAI Composer 2.5 等模型
- 模型选择器支持刷新缓存、本地缓存推荐模型、MiniMax-M3 正确上报1M上下文
- Anthropic 模型适配思维契约、自动适配推理强度、高价模型二次确认
- 自动识别OpenRouter凭证、Codex OAuth账号隔离、xAI令牌跨档案同步、支持自定义OpenAI兼容提供商请求头
- Bedrock 流权限不足时自动降级非流式、Ollama 默认最大Token设为65536、模型拒绝统一按内容过滤上报
会话与多代理
- 可选会话数量上限、退出时自动清理空会话、会话元数据支持压缩轮转
- 子代理支持自定义端点池、移除默认超时限制、修复子代理进度泄露到父会话问题
- 看板功能支持配置自动订阅、全局单例调度锁、工作进程绑定对应档案工具集
3.4 消息平台网关
新增渠道
- iMessage(Photon Spectrum):设备码OAuth认证、gRPC原生通道、Markdown渲染、表情反应、媒体发送
- WhatsApp Business Cloud API:官方托管通道、无桥接进程
- SimpleX:群组支持、原生附件、文本批量处理、自动接受
- Raft 平台插件:内置适配、活动钩子
渲染与平台优化
- 终端工具调用在Markdown平台渲染为原生代码块、聊天支持裸代码块、可选消息时间戳、工具进度分组配置
- Telegram:Bot API 10.1富消息默认开启、可选在线状态、长消息不截断、进度编辑用MarkdownV2、大文件前置校验
- Discord:角色权限全链路生效、网关异常自动恢复、连接失败取消任务、回复后停止输入状态
- Slack:回复线程配置生效、线程审批交互优化、视频附件可被代理读取、注册动作处理器插件API
- 全平台回复媒体附件统一处理、文档类型正确分类、WhatsApp桥接进程自动重启、Matrix房间隔离、QQbot CPU占用修复、微信限流熔断
3.5 CLI、TUI 与安装
- 新增
/version斜杠命令、交互式账单查询、状态栏显示上次响应时间、审批提示持久化到滚动记录 - 工作树并发锁保护、档案支持自定义别名、支持从任意源克隆档案
- 首次启动可选结构化引导配置、平台级系统提示可配置、后台任务通知可配置
- TUI 支持插件中心开关覆盖、会话名显示到终端标题、弹窗直接渲染审批提示、长命令自动换行
- TTS 支持 Gemini 人设提示、xAI 自动语音标签、Piper 音色选择、Telegram 自动TTS用OGG格式
3.6 工具系统、技能与 MCP
- 图像生成全后端支持图生图编辑、自动按提供商限制缩放图片
- MCP 生态:新增官方 UE 5.8 服务器、工具调用中途确认机制、回合间动态新增工具、短会话保活、可疑配置拦截、纯提示服务器兼容、Windows环境变量透传
- 技能体系:新增代码简化技能(三代理并行评审)、用户修改技能检测、可选支付技能、命令行商店技能
- 技能管理器:合并功能改为默认关闭,仅保留过期清理
- 插件:支持仓库子目录安装、支持粘贴GitHub链接安装、新增会话压缩生命周期事件
- 内存/技能写入审批开关:布尔型配置替代三态模式
3.7 集群、中继与自动化
- 托管作用域:管理员根目录配置全局不可修改的配置与密钥
- 单网关进程复用多档案(可选开启)
- 可插拔定时调度器 + Chronos 托管定时提供商(支持缩容到零)
- 自动化蓝图:全端统一参数化模板
- 网关中继:0-3阶段落地,支持适配器、签名鉴权、WebSocket入站、自托管客户端
3.8 Docker、Nix 与安装器
- Docker:镜像体积优化、预安装矩阵依赖、托管部署防自修改加固
- s6 进程守护:直接检测进程、注册网关不自动启动、状态持久化、清理日志锁
- Nix:冷构建修复、锁文件自动修复、无哈希npm依赖、Electron版本对齐
- 安装器:自动暂存前清理索引、安装方式标记按代码树隔离
3.9 安全与可靠性
- 网关适配器默认失败关闭、无白名单时审批按钮鉴权失败关闭
- 请求调试输出脱敏、公共状态隐藏主机元数据、MCP可疑配置拦截
- 修复Shell转义绕过、子进程环境清理、内容长度限制、定时任务提示校验
- 升级 urllib3 与 PyJWT 修复CVE、Langfuse base64数据脱敏修复
3.10 Windows 平台适配
- 仪表盘聊天页通过 ConPTY 实现、修复 uv 安装PowerShell解析、桌面安装路径解析修复
- winget 注册修复、PATH刷新、更新时释放文件锁、注册表读取环境变量
- 进程守护可靠性提升、PTY输入与WebSocket帧处理、子进程输出UTF-8解码、原生确认弹窗
3.11 重要 Bug 修复
- 非ASCII URL组件百分号编码、FTS5查询冒号兼容修复
- 崩溃恢复保留多模态内容、多模态内容同步前扁平化、压缩输入剥离媒体指令
- Nous 429错误重试机制修复、免费模型屏蔽额度暂停提示
- 定时任务无技能作业不扫描注入输出、自定义提供商解析修复、容器重启权限修复
注:本版本累计关闭300+社区Issue,以上为高影响修复条目。
四、本版本回退内容
以下功能在开发周期内完成但最终未随本版本发布:
html-artifact技能及草图/架构图/概念图相关能力,已回退- 定时任务单作业档案支持功能,已回退
- 一项 Nix 补丁阶段的临时适配方案,已回退
Hermes Agent v0.17.0 · The Reach Release · 2026











