GoForum🌐 V2EX

想直接接管已登录的 Safari 来做网页操作,大家有啥顺手的 skill / MCP 吗?

x4gz · 2026-03-21 23:24 · 0 次点赞 · 0 条回复

这两天在折腾 Codex 里的 skill 和 MCP ,目标很朴素:别开新浏览器会话,直接用我当前已经打开、已经登录的 Safari 去把事做完。

目前自己试下来的感受是:

  • 纯 WebDriver 路线做页面自动化没问题,但继承不了现成登录态
  • 如果想直接操作当前 Safari tab ,就得混 AppleScript 、System Events 、Accessibility ,必要时还得上 OCR / 坐标点击
  • 能用,但链路有点长,稳定性也比较吃页面和系统弹窗

所以想问下各位:

  1. 你们现在有啥好用的 skill / MCP / 工具链,是专门拿来控制 Safari 的?
  2. 有没有比较顺手的 existing-tab / logged-in session 方案?
  3. 除了 Playwright 之外,有没有更适合“直接操作正在使用的 Safari”的路子?

如果有现成方案、踩坑经验、或者自己搓过类似工具,欢迎分享下。

0 条回复
添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: x4gz
发布: 2026-03-21
点赞: 0
回复: 0