Manus 的爆火预示着 AI 正在从单纯的文本生成和图像识别迈向更复杂的交互场景。字节跳动近期推出的开源项目 UI-TARS Desktop 为我们展示了一种全新的可能性:能够通过自然语言理解和处理来控制计算机界面。这款工具代表了人工智能与人机交互领域的重大突破,为用户提供了一种全新的、更加自然的方式来操作计算机系统。

在项目落地实践中,高效稳定的底层模型支撑很关键,PPIO 派欧云作为一站式 AIGC 云服务平台,提供高性能的 API 服务,涵盖了最新的 DeepSeek、QwQ 等系列模型,低价、稳定、快速,仅需一行代码即可调用。

PPIO x UI-Tars 图文使用教程

  1. 配置前置条件

(1)获取【API Base URL】:固定为:https://api.ppinfra.com/v3/openai

(2) 获取【API Key】:登录派欧云控制台API密钥管理页面,点击创建按钮。注册账号填写邀请码【VOJL20】得代金券

(3)生成并保存【API密钥】

!!注意:密钥在服务端是加密存储,请在生成时保存好密钥;若遗失可以在控制台上删除并创建一个新的密钥。

(4)获取需要使用的模型ID,推荐使用:

  • deepseek/deepseek-v3-0324
  • deepseek/deepseek-r1-turbo
  • deepseek/deepseek-v3-turbo
  • qwen/qwq-32b

其他模型 ID、最大上下文及价格可参考:模型列表

  1. 安装和配置 UI-Tars

👉前往:https://github.com/bytedance/UI-TARS-desktop/releases/tag/Agent-TARS-v1.0.0-alpha.5

下载安装最新版本的客户端(目前只支持mac系统)

(1)下载完成后点击左下角【设置】

(2)先打开【Use custom model name】的按钮,在【Model Name】处填写官网的模型名称,在【API Key】处填写创建的密钥,最后在【Custom Endpoint】填写官网的 Base URL,最后点击 Save 即可

运行效果展示

输入我们准备好的prompt:

使用网络浏览器查询旧金山当前的天气情况。

UI - TARS 凭借其强大的自然语言理解与处理技术,精准地执行了我们 “获取旧金山天气信息” 的指令。当下达指令后,它通过浏览器查到旧金山地区的天气数据源。最终,清晰、准确地为我们呈现当下的天气信息,复杂交互场景中其执行能力与信息获取能力有所表现。