一、版本概况
发布版本:v2026.5.7(内核版本:v0.13.0)
版本代号:The Tenacity Release(坚韧版本)
发布时间:2026年5月7日
更新规模:相较v0.12.0版本,累计完成864次提交、588个合并PR、829个文件变更,新增128366行代码;关闭282个issue(含13个P0级、36个P1级关键问题);共有295位社区贡献者(含合著者)参与本次迭代开发。
核心目标:聚焦智能体任务闭环能力提升,强化系统安全防护,推进架构插件化改造,完善多语言本地化支持,全面优化终端交互与运维体验,大幅提升智能体的稳定性、扩展性与易用性。
二、核心重磅:任务闭环能力全面升级
2.1 持久化多智能体Kanban看板
本次版本核心新增功能,实现多智能体协同任务全流程闭环管理,彻底解决任务中断、遗漏问题:
-
多项目支持:单实例可部署多个看板,支持任务分发、多Hermes Worker自动认领、任务交接与完结全流程。
-
可靠性保障:内置心跳检测、僵尸进程识别、异常任务回收机制,配备单任务重试预算、幻觉检测与恢复功能,确保任务不中断、不遗漏。
-
异常管控:异常退出的Worker会被自动阻断,避免无效任务占用资源;配套完善的看板仪表盘、平台通知开关与通用诊断引擎,可实时监控任务状态。
-
细节优化:支持多配置文件共享看板、工作区与Worker日志;提供多行文本输入框用于任务创建;优化看板界面样式与交互逻辑,修复多项仪表盘显示与功能异常。
2.2 /goal 跨轮次持久目标系统
-
新增
/goal斜杠指令,可锁定智能体核心目标,实现跨对话轮次持续聚焦任务,原生集成Ralph循环机制,避免智能体偏离初始需求。 -
支持配置目标轮次预算,可根据任务复杂度灵活设定智能体聚焦目标的最大轮次,进一步提升任务执行效率。
-
配套完善官方文档,详细说明目标配置、轮次调整等操作方法,降低使用门槛。
2.3 状态持久化与会话可靠性升级
-
Checkpoints v2:重写状态持久化逻辑,实现真正的增量修剪与磁盘防护机制,彻底解决孤立影子仓库问题,提升状态存储的稳定性与高效性。
-
会话自动恢复:网关重启、版本更新中断、源码重载后,对话会话可自动恢复,完整保留待执行指令、线程路由、会话元数据与未完成任务,无需重新发起请求。
-
细节优化:保留待更新提示、首页频道线程目标、助手元数据等关键信息,确保会话恢复后体验连贯;优化会话线程驱逐逻辑,优先保留最新会话内容。
三、安全加固专项:8个P0漏洞闭环,全面提升防护能力
本次版本重点开展安全专项升级,成功修复8个P0级高危漏洞,全方位强化系统安全防护,核心升级如下:
-
敏感信息脱敏:默认开启敏感信息脱敏功能,从源头过滤凭证、密钥等敏感内容,避免信息泄露风险;可根据需求手动关闭该功能。
-
Discord安全优化:将角色白名单升级为服务器维度,修复CVSS 8.1级跨服务器DM绕过漏洞,强化权限管控。
-
WhatsApp防护:默认拒绝陌生人消息,禁止智能体在自我对话中响应,减少恶意请求干扰。
-
漏洞修复:关闭MCP OAuth与auth.json凭证写入的TOCTOU竞争条件漏洞;浏览器混合路由强制启用云元数据SSRF防护底线,防范服务器端请求伪造攻击。
-
注入防护:Cron任务执行前,自动扫描组装后的提示词与技能内容,防范提示词注入攻击;
hermes debug share命令上传日志时,自动脱敏敏感内容。 -
权限强化:.env、auth.json、state.db文件默认使用0600权限,仅允许所有者读写;仪表盘插件脚本新增SRI完整性校验,防范脚本篡改;Google Meet服务默认绑定本地主机,限制外部访问。
-
其他加固:扩展敏感文件写入防护范围,覆盖shell RC文件与凭证文件;优化YOLO模式环境变量解析逻辑,防范恶意参数注入;新增OSV-Scanner CI与Dependabot依赖安全检测,及时修复第三方依赖漏洞。
四、核心架构升级:全面插件化,扩展性拉满
4.1 推理提供商插件化改造
-
新增
ProviderProfile抽象基类与plugins/model-providers/插件目录,第三方推理提供商可无需修改核心代码,直接通过插件形式接入,大幅降低扩展成本。 -
指令优化:移除
/provider指令别名,统一使用/model指令,新增凭证过滤的提供商选择器,便于快速筛选可用提供商。 -
登录态优化:Nous OAuth登录态支持跨配置文件共享,一次登录后,所有配置文件可继承会话,无需重复认证。
4.2 全链路插件体系扩展
-
平台插件化:新增通用平台插件钩子(
env_enablement_fn/cron_deliver_env_var),IRC、Microsoft Teams已完成插件化迁移,第三方消息平台可无缝接入。 -
生命周期钩子:新增
transform_llm_output插件钩子,可在LLM输出进入对话前,对内容进行重塑或过滤,适配内容过滤、上下文缩减等场景。 -
文档完善:补充插件开发全流程文档,覆盖模型提供商、技能、平台插件的开发、部署与调试指南,降低插件开发门槛。
4.3 API服务器升级
-
新增
X-Hermes-Session-Key请求头,为记忆提供商提供稳定的会话标识,支持会话级长期记忆,实现跨请求记忆连贯。 -
完善API功能,补充会话管理、运行状态暴露等能力,提升API调用的稳定性与易用性。
五、原生能力扩展:视频理解、语音克隆、多语言本地化
5.1 原生视频理解能力
新增
video_analyze工具,基于Gemini等兼容多模态模型,实现原生视频内容分析与理解,可提取视频关键信息、解析视频内容逻辑,拓展智能体多模态处理场景。5.2 语音克隆与TTS升级
新增xAI Custom Voices TTS提供商,原生支持语音克隆能力,可快速克隆目标语音风格;完善插件化TTS注册机制,支持第三方TTS提供商灵活接入,满足多样化语音合成需求。
5.3 7国语言本地化支持
-
界面本地化:网关与CLI静态消息支持7种语言,包括简体中文、日语、德语、西班牙语、法语、乌克兰语、土耳其语,可通过
display.language配置一键切换。 -
文档本地化:官方文档站点新增简体中文(zh-Hans)本地化,配套中文README、快速入门指南与功能文档,降低中文用户上手门槛。
六、消息平台扩展:第20个平台上线,全平台权限管控
6.1 新增Google Chat平台
正式上线Google Chat消息平台,成为第20个官方支持的消息平台,依托通用平台插件钩子实现完全插件化接入,支持文本、媒体消息原生传输,适配企业级使用场景。
6.2 全平台白名单管控
Slack、Telegram、Mattermost、Matrix、钉钉全平台支持
allowed_channels/allowed_chats/allowed_rooms白名单配置,可精细化管控智能体消息响应范围,避免无关频道、会话干扰。6.3 各平台细节优化
-
Telegram:支持DM用户自定义多会话主题,优化论坛频道通用频道(thread_id=1)的输入指示器适配,修复多项消息传输与显示问题。
-
Discord:新增消息删除动作,修复
free_response_channels配置优先级高于DISCORD_IGNORE_NO_MENTION的问题,优化斜杠命令同步机制。 -
QQBot:原生支持审批键盘、分片上传、引用附件功能,对齐Telegram、Discord的审批交互体验,优化SDK性能。
-
飞书:支持机器人准入与@策略配置,Markdown表格强制文本模式渲染,修复多项消息适配问题。
-
Microsoft Teams:新增侧边栏与线程功能,支持群聊降级方案,完善官方文档与使用指南。
-
通用优化:支持会话自动恢复、平台重启通知开关、斜杠命令系统通知自动删除等功能,提升全平台使用体验。
七、工具与技能生态升级
7.1 MCP能力全面升级
-
传输优化:支持SSE传输与OAuth凭证转发,延长SSE读取超时时间,失效管道自动重试,提升传输稳定性。
-
功能完善:图片工具结果以MEDIA标签展示,不再被丢弃;长生命周期等待新增保活机制,避免连接中断。
-
Bug修复:修复会话重连、参数校验、错误提示等多项问题,优化MCP服务器启动与任务执行逻辑。
7.2 文件工具智能校验
write_file与patch操作新增写入后增量lint校验功能,原生支持Python、JSON、YAML、TOML四种格式的语法检查,可立即暴露语法错误,避免问题向下游传递,提升文件操作的准确性。7.3 Curator功能扩展
-
新增子命令:新增
hermes curator archive(归档)、hermes curator prune(修剪)、hermes curator list-archived(查看归档)三个子命令,实现技能归档的精细化管理。 -
执行优化:手动执行
hermes curator run改为同步模式,执行后直接输出结果,无需轮询查看,提升操作效率;修复多项归档、修剪逻辑异常,保护核心技能不被误操作。
7.4 Web工具与搜索升级
-
新增SearXNG原生搜索后端,支持按能力选择不同后端(搜索、提取、浏览能力分离),提升搜索灵活性与准确性。
-
缓存优化:OpenRouter新增响应缓存显式控制能力,可根据需求配置缓存策略,降低重复请求成本。
7.5 新增6个可选技能
本次迭代新增6个可选技能,丰富技能生态,覆盖电商、金融、搜索等多场景:
-
Shopify:支持Admin与Storefront GraphQL操作,适配电商管理场景。
-
here.now:基础功能扩展技能,补充场景化能力。
-
shop-app:个人购物助手,提供个性化购物建议与管理能力。
-
Anthropic金融服务套件:移植自Anthropic,提供金融相关辅助功能。
-
kanban-video-orchestrator:创意类技能,实现看板与视频协同调度。
-
searxng-search:适配SearXNG搜索后端的搜索技能,完善搜索功能。
八、CLI/TUI/仪表盘体验全面优化
8.1 CLI升级
-
提示优化:新增100条CLI启动提示,覆盖cron、kanban、curator等进阶功能,帮助用户快速掌握高级操作。
-
指令优化:
/new指令支持可选会话名称参数,可自定义会话标识;新增hermes update --yes/-y免交互更新选项,提升更新效率。 -
本地化支持:新增
display.language配置,一键切换CLI界面语言,适配多语言用户需求。 -
Bug修复:修复CLI启动
Invalid key 'c-S-c'崩溃问题、绝对路径补全异常、本地后端启动目录错误等问题。
8.2 TUI焕新
-
选择器重构:重构
/model选择器,对齐hermes model功能,支持内联认证,操作更便捷。 -
界面优化:启动横幅新增可折叠板块(技能、系统提示、MCP等),状态栏实时显示上下文压缩计数,提升界面可读性。
-
性能与体验:修复语音按键通话能力,优化渲染性能,减少无效渲染;恢复语音推送通话功能 parity,提升语音交互体验。
8.3 仪表盘升级
-
功能新增:新增插件管理页面(支持启用/禁用插件、查看认证状态)、配置文件管理页面,实现插件与配置的集中管理。
-
体验优化:分析表支持交互式排序,新增18px大字体默认主题(default-large),提升视觉体验;支持通过
X-Forwarded-Prefix反向代理部署,适配企业级部署场景。 -
Docker适配:Docker环境支持通过
HERMES_DASHBOARD=1启动仪表盘作为侧边进程,简化部署流程。 -
Bug修复:修复仪表盘主题布局偏移、网关模型选择器上下文显示异常等问题。
九、自动化与运维能力升级
9.1 Cron新增no_agent看门狗模式
-
新增
no_agent模式,Cron任务可跳过智能体启动,直接执行脚本;空标准输出时静默执行,非空内容直接原文推送,提升运维效率。 -
Bug修复:修复Cron任务状态并发写入冲突、技能使用计数异常、空
next_run_at任务恢复、预执行脚本无输出时的AI调用冗余等问题。
9.2 ACP适配器升级
-
指令新增:新增
/steer和/queue斜杠命令,可从Zed、VS Code、JetBrains等编辑器直接控制运行中的智能体,或追加后续任务,提升开发协同效率。 -
会话优化:支持会话原子化持久化,重启后完整保留推理元数据;修复Windows WSL会话目录转换、空闲会话
/steer指令执行异常等问题。
9.3 Docker优化
-
安全优化:官方镜像禁止root用户运行网关,降低安全风险;修复文件权限、构建上下文等多项问题,提升容器运行稳定性。
-
文档完善:补充本地推理服务(vLLM、Ollama)连接文档与配置示例,明确
API_SERVER_*环境变量用法,简化Docker部署流程。
十、关键Bug修复与内容调整
10.1 核心问题修复
本次版本共修复360+项Bug,重点解决以下核心问题:
-
稳定性修复:修复CLI启动崩溃、CLOSE_WAIT文件描述符泄漏、智能体空响应死循环等关键问题,提升系统稳定性。
-
配置与权限修复:修复OpenRouter API密钥缺失时的备用提供商优先级问题、后台审查分支运行时配置继承异常等问题。
-
平台相关修复:修复Telegram会话中
/new指令无响应、Matrix网关消息自动脱敏与投递竞态、飞书Markdown表格渲染异常等问题。 -
工具与技能修复:修复工具调用并发RPC冲突、上下文压缩计数异常、Curator归档逻辑错误等问题。
10.2 内容调整与移除
-
指令调整:移除
/provider指令别名,统一使用/model指令,简化指令体系。 -
功能回退:回退computer-use cua-driver相关预备PR,暂不支持该功能,待后续优化后重新上线。












