← 返回博客

OpenClaw 4.25 更新解读:手机推送、浏览器自动化全面升级,AI 代理终于可以离开你的办公桌

OpenClaw 4.25 更新解读:手机推送、浏览器自动化全面升级,AI 代理终于可以离开你的办公桌

“你的代理完成任务时,你的口袋会震动。”

OpenClaw 4.25 刚刚在几个小时前发布了。 在这个最新更新中,他们推出了一些重要的语音功能,你一定想知道。

今天发布的这个版本中,最核心的功能是我自从第一次在 OpenClaw 平台上运行代理以来一直想要的东西:

你的代理现在可以在完成任务后给你的手机发短信。

不是比喻意义上的。如果你有 Telegram,它们一直能做到这一点。但现在是真正的推送通知,推送到你的 iPhone 或 Android 手机——就像 Instagram 或 Twitter 推送通知一样。

代理一完成工作,你的手机就会收到通知。


01 他们是怎么做到的?

他们把 OpenClaw 变成了一个 PWA(渐进式 Web 应用),你可以把它安装到手机的主屏幕上。你只需点击图标,它就会像一个真正的应用程序一样打开。

然后,网关通过网络推送将通知推送到你的设备。

为什么这对我来说是件大事?为什么这对你也应该是件大事?


02 真实场景:我每天运行的多个 AI 代理

我每天都会运行多个代理(我的所有代理都以 Wu-Tang Clan 成员的名字命名):

代理名称职责工作时间
Ghost Face情报收集员早上 5:00 起床,通过 API 从 X、Reddit、Hacker News、LinkedIn、Facebook 群组收集情报
RZA撰写大纲和脚本早上 6:00
Inspectah Deck处理 X 上的所有事务(播客 outreach、发帖)全天
Method Man将长视频剪辑成片段,通过 PostBridge 自动发布全天

在 4.25 之前,我知道这些代理是否完成任务的唯一方式是:

  • 坐在办公桌前盯着终端
  • 手动检查仪表板
  • 打开 Telegram

现在,它们任何一个完成任务的那一刻,我的口袋就会震动。

无论我在健身房、在杂货店,还是在飞往洛杉矶的飞机上——代理会给我发短信。我打开手机,看看完成了什么,审查或批准,代理继续工作。

这就是解锁的关键。

这就是代理只是你需要在办公桌前“ babysit ”的东西,与代理真正在你生活的背景中运行之间的区别。这正是我们都在努力实现的目标。


03 实际工作流:晚上运行,早上审查

如果你把这个功能和我已经运行了两个月的 Mission Control 结合起来,我的整个工作流现在看起来是这样的:

  1. 代理在夜间工作
  2. 我醒来时,手机上有了一排推送通知
  3. 我在手机上点击进入 Mission Control
  4. 我审查生成的视频、脚本、帖子、剪辑
  5. 我批准那些想要发布的
  6. 预定的 cron job 将它们发布到 YouTube 和 X
  7. 我全程不需要碰键盘

这就是 AI 代理真正的价值所在:它们在你不在办公桌的时候帮你运营业务。

4.25 版本终于让这一切在手机上运行起来了。


04 浏览器自动化:Playwright 全面大修

第二个最大的功能是面向开发者/构建者的。任何尝试过在 HeyGen、ChatGPT、Claude 或任何单页应用(SPA)上运行 Playwright 的人都会对此感同身受。

浏览器自动化得到了真正的全面大修。

我正在构建 Cappadonna(我的另一个 Wu-Tang 代理),它负责接收脚本并使用 HeyGen Avatar 5 将其转换成 AI 虚拟人视频。它通过 HeyGen Studio 运行。

在过去 24 小时里,我一直在压力测试 Playwright 和真实生产仪表板之间的每一个 bug:

  • 表单提交后标签 ID 发生变化
  • Playwright session 丢失
  • 编辑器内的 iframe 阻止了快照
  • 仪表板 URL 模式变化

所以当我今天早上读到 4.25 的发布说明,看到他们专门修复了其中几个确切的 bug 时,我笑了。

4.25 中修复的浏览器自动化问题

修复内容PR/Issue 编号说明
表单提交和导航后的稳定标签 ID#46137代理可以在页面转换后继续跟踪元素
CDP 连接丢失时的持久 Playwright session 重连#6728连接断开后自动恢复
支持 iframe 的快照 + 光标可点击检测-代理无需手动上下文切换即可看到并点击 iframe 内的元素
新增 openclaw browser doctor 命令-为你探测 live snapshot,无需自己启动 Playwright codegen
Chrome MCP 命令和 CDP URL 映射修复-多配置文件修复,任何运行多个 Chrome 实例的人都在期待
CDP websocket 握手在第一个命令前的重试机制-代理不会因为首次连接时几百毫秒的延迟而“无声死亡”

如果你在任何现代仪表板上进行浏览器自动化,这个版本就是你需要的。我在过去 24 小时内构建 Cappadonna 时遇到的确切痛点,全部被修复了。团队在一周内就发布了这些修复。

这就是真正的开源 momentum。


05 语音与 TTS:7 个新供应商 + 唤醒词路由

第三个功能对内容创作者来说更微妙,但非常强大:语音和文本转语音(TTS)得到了大规模扩展。

一次发布中新增 7 个 TTS 供应商

供应商特性
WhatsApp Speech完整的 SSML 支持 + Opus PCM 输出
XiaoMi MimoMP3 和 Wave 支持 + 流式合成
ElevenLabs V3添加到 bundled 目录
Volcano Engine多语言 TTS
Edge TTS微软边缘 TTS
Speed Speech本地 CLI 语音提供商
Google GeminiPCM 到 Opus 转码路径,也支持语音备忘录

唤醒词路由

你现在可以为每个代理设置唤醒词。例如:

  • 说 “RZA on the mic” → RZA 醒来
  • 说 “Ghost Face” → Ghost Face 醒来
  • 说任何一个代理的名字 → 它们开始工作

这在纸面上听起来可能像噱头,但如果你曾经尝试在单个语音会话中切换代理,你就知道有多少摩擦。现在你只需要说出名字。

每个代理专属的声音

每个代理终于有了自己的声音。RZA 听起来可以和 Cappadonna 不同,Method Man 听起来可以和 Ghost Face 不同。个性真正感觉像个性,而不是一群相同的机器人合唱。

TTS 现在已经变得如此之好,以至于很难分辨是真人还是 AI。

其他语音功能

  • /TTS chat:可开启/关闭/默认,允许在特定会话中自动开启而不影响全局设置
  • Blue Bubbles(iMessage 桥接插件):现在以语音备忘录的形式传递 TTS,你的代理可以在 iMessage 中给你发语音消息

06 安全加固:严肃项目的标志

第四点告诉你一个项目是否由严肃的人运营。4.25 发布了一个安静但重量级的安全更新,远超周平均水平。

4.25 中的安全修复

安全修复说明
设备 token 范围隔离强制为一个范围签发的 token 不能在其他范围使用。你给了窄权限,它就只有窄权限
编辑配置应用于持久化记录如果你设置了 API 密钥的编辑配置,编辑在数据写入磁盘之前发生,而不仅仅是在显示之前
Tailscale 认证跳过配对往返如果你已经在可信的 Tailscale 网络上,不再需要每次都被要求重新配对
混合版本网关服务阻止4.2 的网关不能意外地与 4.25 的插件通信,反之亦然。系统在问题无声失效前捕获它
TLS 启用的网关控制 UI 和 WebSocket控制平面获得与代理运行相同的传输安全
启动代理 token 轮换和陈旧 token 不匹配循环终止解决了一类导致僵尸服务失败的问题

一个版本中有 6 个身份和加固修复。这是一个严肃的版本。

你在给代理很多权限:你的密钥、你的网关、你的机器人、你的账户。你希望持有这些凭证的项目是由那些阅读安全议题并每周发布修复的人运营的。4.25 就是这样的更新。


07 其他值得注意的更新

OpenTelemetry 扩展

  • 完整的 GenAI 语义约定,包括 token 使用直方图和模型调用持续时间直方图(均按 openclaw.agent 维度标记)
  • 如果你运行 Grafana,你终于可以看到每个代理的 token 花费(RZA vs Cappadonna vs Method Man)
  • 针对 traces、metrics 和 logs 的信号特定端点覆盖
  • W3C traceparent header 传播
  • 捆绑的诊断 Prometheus 插件,带 gateway scrape 路由

模型支持

  • DeepSeek V4 Pro 和 V4 Flash:通过 Venice 和 OpenRouter 新增两个路由选项,保留推理内容占位符

图像生成

  • --background--aspect-ratio--resolution 标志暴露给 CLI 用于图像编辑,不再需要降到提供商原生配置来控制输出尺寸

插件注册表大修

  • 安装元数据移到持久化索引
  • 新增 openclaw plugins registry inspect 命令
  • 支持 onAgentFinalize hooks(插件作者一直在要求)

其他改进

  • Heartbeat cron jobs 和 exec runs 现在被视为 transient runtime context,而不是注入到可见 prompt 中
  • Skill workshop 和 active memory 现在在配置的代理默认模型上运行
  • Telegram 终于为 threading replies 渲染原生引用摘录

移除/弃用

  • openclaw disable persistent 插件标记为弃用,3 个月后移除
  • plugins.installs 配置完全移除,迁移到持久化索引
  • 从启动和 provider path 中移除了 legacy manifest alias scans
  • 移除了 /tmp/openclaw fallback

更干净的系统,更小的攻击面。


08 大局观:这为什么重要?

4.25 正好在 4.24 发布一天后发布(4.24 带来了很棒的 Google Meet 集成),并且完美地叠加在它之上。

想象一下这个工作流:

  1. 一个 Google Meet 通话
  2. 你的代理加入通话
  3. 它监听唤醒词
  4. 它通过 7 个新 TTS 提供商之一回复
  5. 通话结束的瞬间,它将 action items 推送到你的手机

这个工作流上周还不存在,但现在它存在了。

PWA 和 web push 实现的“手机作为控制界面”是让你在路上就能使用这个东西的关键,而不是只能在办公桌前 babysit 它。

浏览器自动化可靠性修复是对仪表板驱动工作流爆炸的直接回应。这正是人们正在连接的东西——包括我正在构建的 HeyGen avatar 流水线。

连续两周超过 100 个贡献。这说明这个项目有真正的社区 momentum,而不仅仅是某个人在车库里发布代码。


09 我的建议

如果你在运行 OpenClaw:

  1. 现在就更新
  2. 在手机上安装 PWA
  3. 花 10 分钟设置 web push
  4. 离开你的办公桌
  5. 看着你的代理完成后给你发短信

如果你在做任何类型的仪表板浏览器自动化,Playwright 可靠性修复将使你下一个构建的东西比上一个痛苦减少一半。

如果你还在犹豫要不要加入 AI、还在场边观望:

你需要开始行动了。 你需要开始构建。你需要开始使用这些工具。因为你只能看那么多 YouTube 视频。是时候动手了。


10 资源链接


11 社区与学习

如果你想要:

  • 完整的 OpenClaw 课程
  • 每周 4 次现场训练营(从零开始帮你设置)
  • 一对一的屏幕共享指导

可以查看下面的社区链接。我们 3 天前刚启动,已经有超过 55 名成员。你需要身边有真正在构建的人,能让你保持责任感的人,以及当你卡住时能帮助你的教练。


开始使用:openclaw.ai

加入社区:Discord

GitHub:github.com/openclaw/openclaw

技能市场:0z0z.com

—— OpenClaw 社区

P.S. 听说有人用它自动写周报了。我什么都没说。🦞