UI-TARS 接入 PPIO LLM API
Manus 的爆火预示着 AI 正在从单纯的文本生成和图像识别迈向更复杂的交互场景。字节跳动近期推出的开源项目 UI-TARS Desktop 为我们展示了一种全新的可能性:能够通过自然语言理解和处理来控制计算机界面。这款工具代表了人工智能与人机交互领域的重大突破,为用户提供了一种全新的、更加自然的方式来操作计算机系统。
在项目落地实践中,高效稳定的底层模型支撑很关键,PPIO 派欧云作为一站式 AIGC 云服务平台,提供高性能的 API 服务,涵盖了最新的 DeepSeek、QwQ 等系列模型,低价、稳定、快速,仅需一行代码即可调用。
PPIO x UI-Tars 图文使用教程
- 配置前置条件
(1)获取【API Base URL】:固定为:https://api.ppinfra.com/v3/openai
(2) 获取【API Key】:登录派欧云控制台API密钥管理页面,点击创建按钮。注册账号填写邀请码【VOJL20】得代金券
(3)生成并保存【API密钥】
!!注意:密钥在服务端是加密存储,请在生成时保存好密钥;若遗失可以在控制台上删除并创建一个新的密钥。
(4)获取需要使用的模型ID,推荐使用:
- deepseek/deepseek-v3-0324
- deepseek/deepseek-r1-turbo
- deepseek/deepseek-v3-turbo
- qwen/qwq-32b
其他模型 ID、最大上下文及价格可参考:模型列表
- 安装和配置 UI-Tars
👉前往:https://github.com/bytedance/UI-TARS-desktop/releases/tag/Agent-TARS-v1.0.0-alpha.5
下载安装最新版本的客户端(目前只支持mac系统)
(1)下载完成后点击左下角【设置】
(2)先打开【Use custom model name】的按钮,在【Model Name】处填写官网的模型名称,在【API Key】处填写创建的密钥,最后在【Custom Endpoint】填写官网的 Base URL,最后点击 Save 即可
运行效果展示
输入我们准备好的prompt:
UI - TARS 凭借其强大的自然语言理解与处理技术,精准地执行了我们 “获取旧金山天气信息” 的指令。当下达指令后,它通过浏览器查到旧金山地区的天气数据源。最终,清晰、准确地为我们呈现当下的天气信息,复杂交互场景中其执行能力与信息获取能力有所表现。