大语言模型服务可靠、可扩展、高性价比
使用 API 快速构建生成式AI应用
模型列表
提供行业领先、市场已充分验证的模型列表,帮您出色的完成AI应用建设。
这些模型普遍在角色扮演、故事扩写、代码生成、情感陪伴等领域具备高智商和高情商的表现。
baichuan/baichuan2-13b-chat
Baichuan-13B 百川智能开发的包含 130 亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果
14336 上下文窗口
输入¥1.75/百万 tokens
输出¥1.75/百万 tokens
meta-llama/llama-3.1-70b-instruct
Meta最新一代的Llama 3.1模型系列,70B(700亿参数)的指令微调版本针对高质量对话场景进行了优化。在业界评估中,与领先的闭源模型相比,它展现出了强劲的性能。(仅针对企业实名认证通过主体开放)
32768 上下文窗口
输入¥4/百万 tokens
输出¥4/百万 tokens
meta-llama/llama-3.1-8b-instruct
Meta最新一代的Llama 3.1模型系列,8B(80亿参数)的指令微调版本特别快速高效。在业界评估中,表现出强劲的性能,超越了很多领先的闭源模型。(仅针对企业实名认证通过主体开放)
32768 上下文窗口
输入¥0.4/百万 tokens
输出¥0.4/百万 tokens
01-ai/yi-1.5-34b-chat
零一万物,最新开源微调模型,340亿参数,微调支持多种对话场景,高质量训练数据,对齐人类偏好。
16384 上下文窗口
输入¥1.1/百万 tokens
输出¥1.1/百万 tokens
01-ai/yi-1.5-9b-chat
零一万物,最新开源微调模型,90亿参数,微调支持多种对话场景,高质量训练数据,对齐人类偏好。
16384 上下文窗口
输入¥0.4/百万 tokens
输出¥0.4/百万 tokens
thudm/glm-4-9b-chat
智谱AI发布的GLM-4系列最新一代预训练模型的开源版本。
32768 上下文窗口
输入¥0.5/百万 tokens
输出¥0.5/百万 tokens
qwen/qwen-2-7b-instruct
Qwen2是全新的Qwen大型语言模型系列。Qwen2 7B是一个基于transformer的模型,在语言理解、多语言能力、编程、数学和推理方面表现出色。
32768 上下文窗口
输入¥0.32/百万 tokens
输出¥0.32/百万 tokens
qwen/qwen-2-72b-instruct
Qwen2是全新的Qwen大型语言模型系列。Qwen2 72B是一个基于transformer的模型,在语言理解、多语言能力、编程、数学和推理方面表现出色。
32768 上下文窗口
输入¥4/百万 tokens
输出¥4/百万 tokens
简单易用:只需一行代码,开发者即可快速使用派欧云的模型服务。
复制
from openai import OpenAI
client = OpenAI(
base_url='https://api.ppinfra.com/llm/v1',
api_key='<你的 API KEY>',
# 获取 API Key 请参考:https://ppinfra.com/docs/get-started/quickstart.html#_2-管理-api-密钥
)
completion_res = client.completions.create(
model='Qwen2-7B-Instruct',
prompt='派欧算力云提供 GPU 云产品能用于哪些场景?',
stream=True,
max_tokens=512,
)
大型语言模型
派欧算力云为您提供企业级大语言模型服务,比您自行部署 AI Infra,更可靠、更快、更经济、更具扩展性。
您可将精力集中在应用增长和客户服务上,而大型语言模型基础设施可放心交给派欧算力云
可靠稳定
全球网络加速
推理低时延、稳定
超高性价比
按使用量计费
低成本,服务好
快速扩容
高效扩展 AI Infra
解决高峰负载问题
典型应用场景
AI 情感陪伴机器人
AI 小说生成器
AI 总结摘要
AI 代码生成