一、版本概况
发布版本:v2026.4.30(内核版本:v0.12.0)
版本代号:The Curator Release(馆长版本)
发布时间:2026年4月30日
核心目标:实现Agent自主运维能力,扩展技能生态与第三方集成,优化终端交互体验,强化系统稳定性与安全性,同步完成多方面问题修复。
二、核心更新:Autonomous Curator 自主代理管理
本次Hermes Agent版本最核心更新为新增Autonomous Curator(自主馆长代理),实现Agent自我维护与技能库自主管理,具体功能如下:
- 后台常驻运行:依托网关的定时任务(默认7天周期)自动执行,无需手动触发。
- 技能库自主管理:自动对技能库进行评分、合并同类技能、清理失效技能,实现技能生命周期自动化管控。
- 运行报告生成:每次运行后自动生成两份报告,分别为日志文件(logs/curator/run.json)和复盘报告(md),便于查看运维详情。
- 专属操作指令:新增hermes curator系列指令,支持查看运行状态(hermes curator status),可按使用频率排序技能,清晰呈现技能使用情况。
- 统一配置入口:Curator功能统一归属于curator模块,可在hermes model中选择Curator所用模型,通过控制台面板完成全部配置。
- 权限安全管控:继承主程序的运行时配置(提供商、模型、凭证),且仅限定操作记忆与技能工具集,避免越权执行风险。
三、自我提升循环优化
对Agent核心的自我提升循环(后台审查分支)进行大幅升级,优化技能更新与记忆管理逻辑:
- 采用类优先模式:以评分标准为基础进行技能审查,替代原有的自由形式判断,提升技能更新的规范性。
- 主动更新倾向:优先更新Agent刚刚加载使用的技能,同时支持处理references/、templates/子文件,完善技能更新覆盖范围。
- 运行时继承优化:确保后台审查分支能完整继承父程序的实时运行配置,包括提供商、模型、凭证等关键信息,避免配置脱节。
- 上下文清理:排除历史对话中的工具消息,为审查分支提供干净的上下文环境,提升判断准确性。
- 内存管理优化:记忆提供商可正常关闭,避免资源占用,提升系统稳定性。
四、技能生态升级
4.1 核心技能新增与升级
- ComfyUI v5:从可选技能升级为默认内置,支持官方CLI、REST接口及硬件门槛本地安装,完善图文处理能力。
- TouchDesigner-MCP:升级为默认内置技能,新增GLSL特效、后期处理、音频处理、几何处理等功能,配套新增9份官方参考文档,提升使用便捷性。
- 新增技能:Humanizer(移除文本中的AI化表达,实现文本拟人化)、claude-design(HTML artifacts技能)、design-md(适配Google DESIGN.md规范)、airtable(数据管理技能)等。
4.2 技能操作优化
- 支持通过直接HTTP(S) URL安装技能,指令为hermes skills install <url>,简化技能获取流程。
- 新增/reload-skills斜杠命令,可快速重载技能库,无需重启Agent。
- 优化技能管理逻辑:skill_manage工具拒绝修改已固定的技能,固定功能可阻止Curator对技能的修改,保护核心技能安全。
五、推理提供商与模型支持扩展
5.1 新增推理提供商
- GMI Cloud:作为一级原生提供商,支持API密钥认证,与现有主流提供商(如Arcee、Kilocode等)功能对等。
- Azure AI Foundry:支持自动检测配置,实现全流程适配,提升企业级场景兼容性。
- MiniMax:采用OAuth PKCE浏览器授权流程,完善安全认证机制,适配各类使用场景。
- LM Studio:从自定义端点别名升级为一级原生提供商,支持专属认证、hermes doctor状态检查、推理传输优化及实时模型列表展示。
5.2 模型相关优化
- 多模态图像路由:图像任务将根据模型的实际视觉能力进行分配,替代原有的按提供商默认规则分配,提升图文处理适配度。
- 提示缓存优化:新增可配置的cache_ttl参数,默认缓存时间为5分钟,可选1小时,减少重复请求,降低使用成本。
六、消息平台与网关优化
6.1 新增消息平台
- 腾讯元宝(Yuanbao):作为第18个消息平台,支持文本与媒体消息的原生传输,适配国内使用场景。
- Microsoft Teams:作为第19个消息平台,以插件形式发布,实现插件化接入,同时新增跨进程冲突防护机制。
6.2 网关架构升级
- 插件化网关平台:消息适配器可独立于核心代码存在,实现插件化插拔,便于快速扩展新的消息平台。
- 媒体传输优化:实现Telegram、Discord、Slack、Mattermost、Email、Signal等平台的原生多图发送功能;统一音频路由,支持FLAC格式,新增Telegram文档 fallback机制,提升音频传输稳定性。
6.3 各平台细节优化
- Telegram:支持群组和论坛的聊天白名单设置,优化预览流刷新逻辑,支持Markdown表格渲染。
- Slack:将所有网关命令注册为原生斜杠命令,新增strict_mention配置(防止线程自动参与)和channel_skill_bindings配置(将技能绑定到指定频道)。
- Signal:支持Markdown格式转换、回复引用、消息反应等原生功能,提升交互体验。
七、第三方应用原生集成
- Spotify:原生集成7个核心工具(播放、搜索、队列、歌单管理、设备管理等),采用PKCE OAuth认证,配备交互式配置向导,支持定时任务使用,相关操作已完善文档说明。
- Google Meet:以插件形式集成,支持加入会议、实时转录、语音交互、会后跟进等全流程功能,内置实时OpenAI传输与Node机器人服务器,无需额外配置即可使用。
八、CLI与TUI终端体验优化
8.1 CLI新增功能
- 一键快捷模式:新增hermes -z <prompt>非交互式单次执行模式,支持通过–model、–provider参数或HERMES_INFERENCE_MODEL环境变量指定模型与提供商。
- 更新预检:新增hermes update –check指令,可提前检查更新状态,降低更新风险;支持可选的HERMES_HOME预更新备份功能。
- 其他新增指令:新增hermes fallback指令(管理备用提供商)、/busy斜杠命令(忙碌输入模式)、/btw斜杠命令(作为/background的别名)。
8.2 TUI功能升级
- 功能新增:支持LaTeX渲染、.env配置文件热重载、可插拔忙碌指示器样式、可选的最近会话自动恢复、会话删除(在/resume选择器中按d删除)、鼠标滚轮逐行滚动等。
- 体验优化:扩展浅色终端自动检测功能(支持HERMES_TUI_THEME环境变量与背景色配置),新增输入框?快捷键调用迷你帮助菜单,支持语音模式CLI对等功能(VAD循环、TTS、崩溃取证)。
- 性能提升:通过延迟Agent初始化、延迟导入第三方依赖、缓存配置与工具定义等方式,将TUI可见冷启动时间降低约57%,提升启动速度。
九、工具系统与插件优化
- 插件架构升级:网关平台支持插件化接入,Microsoft Teams为首个插件化平台;新增pre_gateway_dispatch、pre_approval_request、post_approval_response等钩子,支持插件拦截与扩展。
- 内置插件:捆绑Spotify、Google Meet、Langfuse可观测性、hermes-achievements(会话历史扫描)等插件,丰富功能场景。
- 代码执行与终端:新增Vercel Sandbox作为execute_code/terminal后端;优化Docker容器运行逻辑,以主机用户身份运行容器,避免权限问题;修复SSH传输、本地目录切换等相关bug。
- TTS功能:新增插件化TTS提供商注册机制(providers.<name>),Piper作为原生本地TTS提供商内置,解决本地语音合成需求。
十、系统安全与可靠性优化
- 敏感信息脱敏:默认关闭敏感信息脱敏功能,避免因误识别虚假敏感信息导致工具输出被篡改;需使用时可通过enabled: true手动开启。
- 内容过滤适配:将所有用户注入标记中的[SYSTEM:改为[IMPORTANT:,避免触发Azure内容过滤器,提升兼容性。
- 安全管控:新增不可恢复命令硬黑名单,预编译危险命令模式,强化工具调用安全;完善秘密信息屏蔽工具,提升系统安全性。
- 稳定性修复:修复内存泄漏、进程超时、配置加载异常等问题,确保Agent长期稳定运行;优化文件写入逻辑,保留符号链接,避免文件权限问题。
十一、重点Bug修复(精选)
本次更新共包含360个fix类PR,重点修复以下核心问题:
- 修复后台审查分支无法继承父程序运行时配置的问题,确保提供商、模型、凭证正常同步。
- 修复多模态图像路由逻辑,确保按模型视觉能力分配任务,提升图文处理准确性。
- 修复execute_code功能中并发RPC调用冲突问题,确保代码执行稳定。
- 修复Curator技能状态统计异常问题,确保技能使用频率统计准确。
- 修复Discord平台limit参数类型错误问题,避免功能异常。
- 修复视觉缓存目录错误问题,将缓存目录切换至HERMES_HOME,避免当前目录杂乱。
- 修复跨提供商推理内容隔离问题,确保不同提供商的推理逻辑互不干扰。
十二、文档与测试优化
- 文档更新:新增Curator功能专属文档页面,完善技能安装、插件使用等相关文档;为每个内置和可选技能生成专属文档页面,自动包裹ASCII艺术代码块,提升可读性。
- 测试优化:保持全量密闭测试一致性,新增Microsoft Teams跨进程冲突防护,避免测试时出现进程冲突;清理无用导入与局部变量,优化代码质量。
十三、移除与回退功能
- 移除Kanban多配置协作板,待设计优化后重新上线。
- 回退computer-use cua-driver相关3个预备PR,暂不支持该功能。
- 移除内置md钩子,提供钩子教程,支持用户通过shell钩子自定义实现相同功能。
- 移除/reload、/plan斜杠命令,清理冗余指令,优化命令体系。
- 完全移除flush_memories相关逻辑,简化内存管理流程。
详细内容可参考:https://github.com/NousResearch/hermes-agent/releases/tag/v2026.4.30












