图片

Hi,我是银海。

最近我在想,现在的 AI 如果真的进入到日常工作里,最先被改变的会是哪一层。

前段时间豆包手机的自动化操作刷屏,更多解决的是移动端的信息和内容问题。

但在真实的工作场景里,绝大多数任务依然发生在电脑上,发生在终端、系统界面和各种复杂的软件之间。

也正是在这样的背景下,我在刷 GitHub 的时候注意到了一个很有意思的开源项目 Turix。

项目地址先放在前面,感兴趣的可以直接点进去看看: https://github.com/TurixAI/TuriX-CUA

图片

从表面看,Turix 也是一个 Computer Use 项目,让模型看懂屏幕、操作界面、完成任务,这可能见怪也不怪了,比如让它查询 iPhone 价格、创建 Pages 文档、并发送给联系人。

图片

比如在老板通过 Discord 发来的 Numbers 文件中生成一个柱状图,将它插入到我的 PowerPoint 的合适位置,并回复老板。

图片

但真正让我停下来认真看的原因,这件事在做个很有意思的点,就是能不能变成一个长期可用的执行系统,能不能持续的跑通任务。

Turix 把终端执行、任务拆解、GUI 操作这些能力全部开源出来,你下载安装到本地之后,只需要在终端里下发一个任务,它就会自动把需求拆成具体步骤,然后一步一步执行。

更重要的是,这些执行流程是可以被保存下来的,下次遇到类似任务,不需要重新来一遍。

一开始我也会有一个直觉反应,这和之前看到的 Computer Use 到底有什么区别。

在Turix网页端:https://cloud.turix.ai/,直接可以选择需要执行的设备,并下发任务给到对应的设备上。

图片

很多 Computer Use 项目,本质上是在一个封闭环境里完成一次完整操作,更像是在验证模型有没有能力操作电脑。你看着它跑,跑完任务就结束了。

而 Turix 的思路明显更偏向工程化。

你在终端里下发的是一个抽象任务,系统负责拆解步骤、调度执行,并把成功跑通的流程沉淀下来复用。

图片

你关注的不再是模型下一步点哪里,而是任务有没有被正确分发,流程能不能稳定跑起来。

这种体验更接近在管理一组数字员工,而不是单次演示模型能力。

有一个很容易被忽略但非常重要的细节,是它对多设备执行的支持。

图片

如果你外接了显示器,或者有多个虚拟桌面,Turix 可以指定在哪一个界面上执行任务。

也就是说,当你下发命令的时候,可以把不同任务分配给不同设备同时跑,而不是在一台机器里排队执行。

这种产品设计明显是从真实办公场景出发的,而不是为了做一个看起来很酷的 Demo。

图片

然后它还能在一个地方给你去回溯这些任务。

图片

再往前看,它已经开始提供空间管理、工作流、定时任务这些能力。

图片

你可以把它理解成一个面向 GUI 世界的调度中枢,模型不只是会点按钮,而是被组织进一套可以持续运转的执行体系里。

另外在Github项目中也顺手了解了一下项目背景,这个项目发起团队的 CTO是一位来自剑桥大学的 00 后,并且团队里面还有来自 Google DeepMind 的高级工程师,不得不佩服,现在的年轻人真的是越来越厉害了。

翻他们的 roadmap 时能明显感受到这是一个有长期规划的项目,对 memory、workflow、自动化调度以及 GUI 识别能力的迭代,都有比较清晰的方向。

图片

我在实际使用上,也是把这个开源项目直接下载下来了,用 Cursor 跑的。

把项目拉下来之后,先让系统自我介绍一遍,搞清楚需要哪些信息,然后配置模型就可以开始了。

图片

Turix 官方提供了自己的模型 API,注册后会有 20 美金的体验额度,用来跑机器控制相关的任务。

他们也提到,官方模型在 GUI 操作上做过专项训练,整体精度会更稳定一些。

图片

如果你有自己的模型服务,也可以直接替换,只需要填写对应的 API 地址、模型 ID 和 key。

图片

我自己试着接了阿里云百炼的千问 VL 系列模型,整体体验也很顺畅,这一点对习惯用不同模型体系的人来说非常友好。

图片

整体用下来,我会觉得 Turix 补齐了 Computer Use 里非常关键的一块,也就是从能力展示走向任务调度和流程复用。

它让模型操作电脑这件事,开始具备进入真实工作流的可能性。

未来如果在 GUI 操作专用模型和自动化能力上持续演进,这类系统的价值会越来越清晰。

现在回头看,会发现很多人第一次用 Turix 时会觉得和 Computer Use 差不多,但用得越久,差异反而越明显。

关注点从模型理解并操作电脑,慢慢转移到了系统能不能变成定时任务进行长期跑,能不能真的帮人减少重复性劳动,节省时间。

如果你对 Computer Use、数字员工或者 AI 自动化执行层感兴趣,强烈建议你去 GitHub 看一眼这个项目,地址再放一次 

https://github.com/TurixAI/TuriX-CUA。

也欢迎顺手点个 star,这类长期主义的开源项目,值得被更多人看到。

以上就是本次的所有分享啦,我们下次再见 👋

© THE END

觉得我的内容还不错,顺手点个赞、分享、在看

都是对我最好的认可!

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐