DeepSeek系列模型是由深度求索(DeepSeek)公司推出的大语言模型。
DeepSeek-R1 模型包含 671B 参数,激活 37B,在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,尤其在数学、代码、自然语言推理等任务上。
DeepSeek-V3 为MoE 模型,671B 参数,激活 37B,在 14.8T Token 上进行了预训练,在长文本、代码、数学、百科、中文能力上表现优秀。
但是现在访问deepseek官网的时候,经常出现服务器繁忙等得我一阵头大
发现现在网上好多云平台都在赠送免费的token可以调用deepseek的满血api今天给大家讲一个比较靠谱,且比较稳定的解决方案:使用阿里云百炼平台配合 Chatbox 完成满血版 DeepSeek 的调用,具体实现步骤如下。也可以访问官网的部署教程:https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms
1.注册并登录阿里云
2.进入Chatbox
a.访问chatbox网站:https://chatboxai.app/zh
b.在设置界面的模型提供方选择添加自定义提供方。
c.进行 API 设置
2.进行对话测试
补充说明:剩余额度和有效期在模型广场-分类选择deepseek-找到R1模型,点击查看详情可以看到当前的剩余额度(用完可以切账号或者更换其他模型)