大语言模型服务可靠、可扩展、高性价比

使用 API 快速构建生成式AI应用

模型列表

提供行业领先、市场已充分验证的模型列表,帮您出色的完成AI应用建设。

这些模型普遍在角色扮演、故事扩写、代码生成、情感陪伴等领域具备高智商和高情商的表现。

baichuan/baichuan2-13b-chat
Baichuan-13B 百川智能开发的包含 130 亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果
14336 上下文窗口
输入1.75/百万 tokens
输出1.75/百万 tokens
meta-llama/llama-3.1-70b-instruct
Meta最新一代的Llama 3.1模型系列,70B(700亿参数)的指令微调版本针对高质量对话场景进行了优化。在业界评估中,与领先的闭源模型相比,它展现出了强劲的性能。(仅针对企业实名认证通过主体开放)
32768 上下文窗口
输入4/百万 tokens
输出4/百万 tokens
meta-llama/llama-3.1-8b-instruct
Meta最新一代的Llama 3.1模型系列,8B(80亿参数)的指令微调版本特别快速高效。在业界评估中,表现出强劲的性能,超越了很多领先的闭源模型。(仅针对企业实名认证通过主体开放)
32768 上下文窗口
输入0.4/百万 tokens
输出0.4/百万 tokens
01-ai/yi-1.5-34b-chat
零一万物,最新开源微调模型,340亿参数,微调支持多种对话场景,高质量训练数据,对齐人类偏好。
16384 上下文窗口
输入1.1/百万 tokens
输出1.1/百万 tokens
01-ai/yi-1.5-9b-chat
零一万物,最新开源微调模型,90亿参数,微调支持多种对话场景,高质量训练数据,对齐人类偏好。
16384 上下文窗口
输入0.4/百万 tokens
输出0.4/百万 tokens
thudm/glm-4-9b-chat
智谱AI发布的GLM-4系列最新一代预训练模型的开源版本。
32768 上下文窗口
输入0.5/百万 tokens
输出0.5/百万 tokens
qwen/qwen-2-7b-instruct
Qwen2是全新的Qwen大型语言模型系列。Qwen2 7B是一个基于transformer的模型,在语言理解、多语言能力、编程、数学和推理方面表现出色。
32768 上下文窗口
输入0.32/百万 tokens
输出0.32/百万 tokens
qwen/qwen-2-72b-instruct
Qwen2是全新的Qwen大型语言模型系列。Qwen2 72B是一个基于transformer的模型,在语言理解、多语言能力、编程、数学和推理方面表现出色。
32768 上下文窗口
输入4/百万 tokens
输出4/百万 tokens
简单易用:只需一行代码,开发者即可快速使用派欧云的模型服务。
Python
Curl
复制
from openai import OpenAI

client = OpenAI(
  base_url='https://api.ppinfra.com/llm/v1',
  api_key='<你的 API KEY>',
  # 获取 API Key 请参考:https://ppinfra.com/docs/get-started/quickstart.html#_2-管理-api-密钥
)

completion_res = client.completions.create(
  model='Qwen2-7B-Instruct',
  prompt='派欧算力云提供 GPU 云产品能用于哪些场景?',
  stream=True,
  max_tokens=512,
)

大型语言模型

派欧算力云为您提供企业级大语言模型服务,比您自行部署 AI Infra,更可靠、更快、更经济、更具扩展性。

您可将精力集中在应用增长和客户服务上,而大型语言模型基础设施可放心交给派欧算力云

可靠稳定
可靠稳定
全球网络加速
推理低时延、稳定
超高性价比
超高性价比
按使用量计费
低成本,服务好
快速扩容
快速扩容
高效扩展 AI Infra
解决高峰负载问题

典型应用场景

AI 情感陪伴机器人
AI 情感陪伴机器人
AI 小说生成器
AI 小说生成器
AI 总结摘要
AI 总结摘要
AI 代码生成
AI 代码生成
24
7X24小时客户服务

我们的服务团队始终在线,确保为您提供连续不断的支持,让您高枕无忧

开启 AI 应用构建之旅
联系我们