1. 如何查看 GPU 实例的价格?

您可以在价格计算器页面查看 GPU 实例的价格及其配置项(系统盘、数据盘、云存储等)费用。

算力市场显示的为参考价格,具体以控制台实际下单结果为准。

2. GPU 实例容器从什么时候开始计费?

在实例状态变更为「拉取镜像状态」时开始计费。

3. 本地盘、系统盘、云存储介绍和区别

  • 系统盘

    • 不支持动态扩容,只能在创建实例时指定容量;
    • 挂载目录: /(不支持自定义);
    • 保存镜像时会保存数据;
    • 支持 100GB 免费额度,超过免费额度后会对超出部分收费,详情参考:计费说明
  • 本地盘

    • 支持动态扩容;
    • 默认挂载目录: /workspace(可自定义);
    • 保存镜像时不会保存数据;
    • 读写速度与系统盘一致;
    • 支持 30GB 免费额度,超过免费额度后会对超出部分收费,详情参考:计费说明
  • 云存储

    • 支持动态扩容;
    • 默认挂载目录: /network(可自定义);
    • 云存储具有独立的生命周期,与实例无关,即使实例删除,云存储的数据依然存在;
    • 读写速度整体比系统盘或本地盘慢(以具体使用情况为准);
    • 云存储容量需要额外收费,详情参考:计费说明

4. 实例停止后为什么无法再开机?

实例停止后,实例所属资源可能已被抢占。这种情况下,建议您先基于目标实例保存镜像,然后基于保存的镜像来创建新的实例。

保存实例镜像后,系统盘的数据会随镜像被一起保存,而本地盘的数据不会。建议对于持久性要求比较高的数据,使用云存储方案进行保存。

5. 实例状态异常该怎么处理?

请先通过实例的「系统日志」和「实例日志」来尝试排查问题,如果无法解决,可以联系我们

6. 没有指定 CUDA 版本的实例规格

CUDA 版本向前兼容。比如,如果您的服务依赖 12.1 版本的 CUDA,可以选择带有大于或等于 12.1 版本 CUDA 的实例规格。

7. 平台支持的最大 CUDA 版本是多少

您可以在算力市场页面右下角的「筛选」模块中查看支持的 CUDA 版本。

8. 保存镜像失败

请先通过「保存镜像」任务的日志来尝试排查问题,以及如果您保存镜像到私有仓库地址,请检查您的镜像仓库认证信息是否正确。如果无法解决,可以联系我们

9. 能否支持独享 IP / 独享带宽 / 专线

支持。目前平台没有对外开放这个能力,如有需求请联系我们

10. 如何查看实例的显卡使用情况?

由于 Docker 容器的 PID 隔离限制,无法使用 nvidia-smi 命令查看进程。您可以安装 py3nvml 库,通过 Python 脚本查看进程占用显卡情况:

# 安装 py3nvml 库
$ pip install py3nvml
# 查看显卡使用情况
$ (base) root@ab9beba1ecf40223:~# py3smi
Fri Sep 20 12:17:39 2024
+-----------------------------------------------------------------------------+
| NVIDIA-SMI                        Driver Version: 550.54.14                 |
+---------------------------------+---------------------+---------------------+
| GPU Fan  Temp Perf Pwr:Usage/Cap|        Memory-Usage | GPU-Util Compute M. |
+=================================+=====================+=====================+
|   5 35%   28C    8   11W / 450W |   353MiB / 24564MiB |       0%    Default |
+---------------------------------+---------------------+---------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
| GPU        Owner      PID      Uptime  Process Name                   Usage |
+=============================================================================+
+-----------------------------------------------------------------------------+

具体安装及详细使用方法,请参考py3nvml 库官方文档