Скиллы Новичок Коммуникация и социальные сети

GitHub 悄悄起飞的开源项目,想让 AI 接管你的电脑

Скачать ZIP
13
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

随着 OpenClaw 的爆火,一种名为 Computer-use-Agent(CUA)的技术正在悄然走红。它的核心能力很简单——让 AI 像人一样操作电脑:看屏幕、点按钮、打开应用、完成任务。

这意味着,AI 不再局限于调用 API,而是可以直接“接管”你的电脑操作,从而完成更多复杂的工作流。

不过现实情况是,目前这类技术仍存在明显分化:

  • 要么是闭源方案,难以定制和扩展
  • 要么是开源项目,但大多停留在 Demo 阶段

今天要介绍的这个项目,试图打破这种局面——它就是 TuriX

一、TuriX 是什么?

TuriX 是一个由 AI 驱动的桌面自动化助手,可以通过自然语言直接操作电脑,实现跨应用的自动化流程。

它的核心理念很直接:

只要人能点的地方,AI 也能点。

这让它与传统 RPA 或 API 自动化工具完全不同——即便目标应用没有提供接口,TuriX 依然可以通过视觉识别 + GUI 操作完成任务。:

目前它支持多平台,包括 Windows、Linux 和 macOS,并且可以:

  • 操作浏览器、文档工具、聊天软件
  • 进行系统设置
  • 执行跨应用流程

同时,它还可以作为一个 Skill 接入 OpenClaw 或 Claude Code,让 AI 真正拥有“眼睛和双手”。:

二、如何快速上手

1. 桌面应用

TuriX 提供开箱即用的桌面客户端,可以直接下载安装后使用。

2. 接入 OpenClaw

如果你使用 OpenClaw,可以通过 Skill 的方式接入 TuriX,实现更强大的自动化能力。

基本流程是:

  • 下载 turix-cua skill 包
  • 复制到 OpenClaw 的 skills 目录
  • 重启或新建 session 加载技能

完成后,你就可以直接询问 AI 当前有哪些技能,验证是否加载成功。

需要注意的是,这个 skill 依赖本地已安装并运行的 TuriX 客户端。

3. Python 调用

对于开发者来说,TuriX 还提供 Python 调用方式,可以:

  • 自定义 LLM API
  • 构建专属自动化工具
  • 集成到复杂系统中

这让它不仅是一个工具,也具备平台属性。

三、技术原理拆解

从本质上看,TuriX 是一个基于视觉语言模型(VLM)的 Agent 框架,通过模拟人类操作 GUI 来完成任务。

它的核心设计是一个“四角色协同架构”:

  • 规划者(Planner):将任务拆解为步骤
  • 执行者(Actor):根据屏幕信息执行操作
  • 评估者(Evaluator):判断执行是否成功
  • 监督者(Supervisor):在失败时重新规划

这种设计可以避免 AI 在复杂任务中陷入死循环,同时提升执行成功率。

另外,TuriX 还引入了并行执行机制:

  • 执行第 N 步时
  • 同时评估第 N-1 步

在保证效率的同时,提高整体稳定性。

在精度方面,它通过系统 API(如 macOS 的 AXUIElement)提取界面结构数据,并结合截图输入模型,从而提升点击和定位的准确性。

此外,团队还对视觉模型进行了专门微调,使其在桌面自动化任务中的表现更稳定。

四、一个更“听劝”的开源项目

比技术更有意思的是,TuriX 的社区氛围。

开发团队对用户反馈的响应非常快:

  • 有人问 Linux 支持?很快上线
  • 有人问本地模型接入?官方手把手指导
  • 有人分享自动化发票流程?直接成为案例

甚至有用户用它自动处理几十份发票,然后只留下了一句话:

“喝杯咖啡的时间。”

这种快速迭代 + 强社区反馈的模式,让这个项目具备了很强的成长潜力。

五、总结

TuriX 的价值不只是“让 AI 自动化操作电脑”,而是在尝试重新定义 AI 与操作系统之间的关系:

  • 从调用接口 → 直接操作界面
  • 从单任务 → 跨应用工作流
  • 从工具 → 数字劳动力

如果它能继续保持现在的迭代速度和社区活跃度,那么“AI 接管电脑操作”这件事,可能很快就会变得习以为常。


Файл из источника

11854_turix-cua-1.0.8.zip