我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
京东云已正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式,供用户按需部署,快速调用。
模式一:公有云在线部署
开发者和企业可以在京东云官网,进入言犀AI开发计算平台的“AI资产市场“中,选用该模型进行一键部署。
言犀AI开发计算平台已经支持DeepSeek-V3、DeepSeek-R1以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署,具体步骤如下:
1、选择基础模型
在“AI资产市场/模型”中,提供DeepSeek开源的多个版本,如DeepSeek-R1-Distill-Qwen-1.5B,点击进入卡片页可了解模型结构和预训练数据等关键信息,并查看模型文件结构。
2、准备资源节点
在部署时,LLM模型因为模型较大,资源性能要求较高,需要独占计算卡进行部署,建议提前准备好专属资源节点。
功能路径:专属资源组-创建资源组-创建节点。
节点规格:部署DeepSeek-R1-Distill,推荐使用cap.p.n3a30.4xlarge;部署DeepSeek-V3,推荐使用cap.hc.p5h20.46xlarge
3、模型部署使用
将模型部署到相应的服务资源上提供推理调用服务,在部署时平台将自动适配预置推理框架,实现一键部署,仅需指定使用的专属资源组和对应的节点规格。部署完成后,状态将会变为运行中,运行中的模型可被调用,提供推理服务。
功能路径:专属资源组-创建资源组-创建节点在线服务-部署;在线服务-服务列表|服务名称-在线调试
模式二:专混模式数据不出域,私有化算力实例部署
专混私有化算力实例部署模式,已经同步上线京东云vGPU AI算力平台,为金融、企业、政府等客户提供数据不出域的私有化模型推理服务。
以DeepSeek R1版本为例,具体的使用步骤如下:
1、进入算力管理页面,点击租用新实例按钮
2、选择资源规格以及对应带有deepseek模型的镜像
3、资源创建成功后进入实例,启动即可与之对话
京东云言犀AI开发计算平台还支持私有化部署及API快速集成,通过自研高性能资源管理与弹性调度系统,可提供大模型的全生命周期服务及部署,涵盖模型开发、推理及多场景应用扩展。
针对资源紧缺的场景,京东云支持通过蒸馏技术训练企业自己的大模型,减少模型部署所需资源的同时具备较好的性能。使用京东云vGPU AI算力平台,可以将多个蒸馏过的企业自有模型部署在同一张卡上,有效提升资源利用率70%。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2025-02-05 14:45:05
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: