• 我的订阅
  • 社会

GPT-4下岗了,上海高校和企业用DeepSeek开发大模型和智能体

类别:社会 发布时间:2025-01-29 21:29:00 来源:缘之心

深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。

达观数据公司去年5月就引入DeepSeek-V2大模型,开发办公智能体(Agent),取得了很好效果。“DeepSeek的性价比极高,而且全面开源,对产业应用很友好。”达观数据董事长、首席执行官陈运文博士说。

大幅提高办公智能体的专业能力

近年来,赵海团队利用GPT-4等基座大模型,为政府和企业开发了十多个垂类大模型。在开发过程中,基座大模型的主要作用是生成合成数据。这类数据通过人工方式生成,而不是从真实世界中获取,用于训练大模型。“我用过一些国产基座大模型,它们的效果和GPT-4比起来,还是有一定差距。”赵海教授告诉记者,“但使用DeepSeek-V3后,我发现它的性能与GPT-4处于同一量级,而价格只有GPT-4的十分之一,所以现在不用GPT-4了。”

与赵海团队相比,达观数据使用DeepSeek更早。陈运文介绍,DeepSeek-V2是一个精简高效的开源模型,只需要相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。

“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比上一个版本V2.5模型提升3倍,达到每秒吞吐量60token。”陈运文介绍,“V3对GPU资源的使用效率极高,因为很多单位没有庞大的GPU集群,DeepSeek这种低资源、高效果的特性有利于今后大规模推广应用。”

DeepSeek-V3为何对GPU资源的使用效率极高?陈运文解释,它运用了多种技术创新,如采用MLA(多头潜在注意力)架构,成功压缩了键值缓存;使用对偶流水线机制,通过设计流水线调度,让GPU算力和通信算力在训练中并行隐藏,成功减少了计算瓶颈,实现几乎不间断的运算;还使用PTX这一接近汇编语言的低级指令集,对GPU进行细致控制,如调整寄存器分配和线程运行方式,从而更精细地管理GPU资源。

本月发布的推理大模型DeepSeek-R1在复杂的数学和逻辑任务上表现优秀,达观数据使用后,大幅度提升了办公智能体在审阅处理复杂的工程报告、金融文书、财务报表、招投标书等专业文档上的能力。

DeepSeek风靡美国后,投资者抛售人工智能主题相关股票,纳斯达克综合指数1月27日显著下跌。新华社发

R系列模型将推动科学智能发展

“DeepSeek-V3和DeepSeek-R1的问世,是大模型领域的标志性事件。”赵海认为,大模型近年来的发展历程可分为三个阶段:第一阶段的标志性事件是ChatGPT问世,其表现令人惊艳,但因为不开源,大多数开发者并不清楚这个大模型是如何开发出来的;在第二阶段,很多团队重现了ChatGPT开发过程,涌现出Llama、Qwen等一批开源大模型,这类模型的性能越来越强,但与OpenAI发布的大模型相比,存在一定差距;DeepSeek-V3和DeepSeek-R1则开启了第三阶段,它们的性能可分别比肩GPT-4和OpenAI o1,意味着开源大模型终于追赶上了闭源大模型。

这位长期研究自然语言处理的学者说,自从OpenAI在2020年发布不开源的GPT-3以来,这家标榜“从事开放性人工智能研究”的机构就背离了初心。如今,随着深度求索公司的异军突起,大模型研发可谓“回归初心”,让开源再度成为业内的主流形态。通过深度求索发布的技术报告,全球开发者都了中国研发团队的创新智慧。可以预见,DeepSeek将引发大模型创新和产业生态的变革。

未来,DeepSeek的R系列推理大模型最值得关注。赵海解释:“过去,ChatGPT等大模型像文科生,不擅长理科和逻辑推理。而对人类智慧来说,最底层的智慧是逻辑,逻辑之上是数学,再上面是物理、化学等科学。”去年9月,OpenAI发布的o1推理大模型改变了“文科生”形象,它擅长逻辑推理和数学,为今后将大模型用于科学研究、处理复杂任务奠定了基础。

目前,DeepSeek-R1的性能与OpenAI o1不分上下,为中国的科学智能(AI for Science)发展提供了利器。在赵海看来,人工智能这门学科的终点是“人工大脑”问世,这种通用人工智能(AGI)设备可用于研究数学、自然科学、社会科学等各个专业领域的复杂问题。未来20年内,科学家有望开发出“人工大脑”,从而颠覆现有的科研范式,使人类获取新知识和解决方案的效率大幅提升。

深度求索创始人梁文锋近日接受专访时表示,DeepSeek的终极目标是实现通用人工智能,而非仅仅追求商业化应用,“生成式AI只是通往AGI的必经之路,AGI有望在我们有生之年实现”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-30 05:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

ChatGPT再出“王炸”,客服都要下岗了?
图片来源@视觉中国文|深燃,作者 | 李秋涵,编辑 | 魏佳席卷社交网络的ChatGPT,最近再次向全世界投放了一个“炸弹”
2023-03-04 14:00:00
上海:加速实施“模塑申城”
本文转自:人民网-上海频道人民网记者 董志雯 葛俊俊上海开年首个科技盛会来了!“2025全球开发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人
2025-02-20 15:49:00
司机都下岗的节奏!黄仁勋:未来汽车将全自动驾驶
快科技1月11日消息,对于司机这个岗位来说,以后可能都有没有必要存在了。英伟达CEO黄仁勋在CES展会上表示,到20年后所有汽车都将具备自动驾驶功能。“特别是下一代纯电动汽车(E
2025-01-11 07:51:00
共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...25全球开发者先锋大会“语料筑基 智生时代”主题论坛在上海市徐汇区正式拉开帷幕。论坛由全球开发者先锋大会组委会指导,由上海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工
2025-02-23 08:49:00
本文转自:人民日报海外版上海徐汇区大模型产业加速发展人工智能引燃“模都”“语料创新技术与应用探索沙龙活动”“多模态大模型应用研讨会”“AI赋能下的开发流程蜕变”……走进位于徐汇西
2025-02-14 04:50:00
AI上海力量崛起背后:创新生态全要素布局,如何再进一步
DeepSeek卷起的AI浪潮,让上海开年第一场科技峰会:2025全球开发者先锋大会(GDC)热度空前。2025年2月22日
2025-02-25 07:51:00
全球科学智能开发者社区在沪启动:提供从模型到开发的全链路支持
全球科学智能开发者社区在上海正式启动。2月21日至2月23日,以“模塑全球 无限可能”为主题的全球开发者先锋大会(GDC2025)在上海徐汇西岸举办。大批软件开发者、AI(人工智
2025-02-22 22:11:00
2024全球开发者先锋大会在上海盛大开幕,聚焦AI与前沿技术
3月23日,备受瞩目的2024全球开发者先锋大会(GDC)在上海西岸穹顶艺术中心开幕。本次大会以“模速空间——开发者的模力之源”为主题,促进汇聚了众多知名开发者、科技先锋、创客精
2024-03-25 01:44:00
...融产业多维赋能闭环。统一两种人工智能技术思路“我来上海参会前,专门‘询问’了ChatGPT,我在开发者大会上可以说些什么。”主旨演讲中,美国国家工程院外籍院士沈向洋提到了So
2024-03-24 06:24:00
更多关于社会的资讯:
鲁网12月25日讯(记者 杜方奇)近日,邮储银行枣庄市台儿庄区支行以专业、高效、贴心的金融服务,为京杭大运河船舶运输客户刘先生成功发放200万元船舶抵押贷款
2025-12-26 10:15:00
“自来水收费不抄表,却要我们每年交固定水费,十分不合理。”近日,有市民在大江新闻《问政江西》栏目发帖反映,瑞昌市高丰镇永兴村自来水收费模式不合理
2025-12-26 06:43:00
昨日,浙江省社科联(省哲学社会科学工作办公室)公布首批12家省哲学社会科学重点实验室认定名单,标志着我省哲学社会科学实验室体系建设进入规范化
2025-12-26 07:09:00
中新经纬12月25日电 国家外汇管理局外汇研究中心主任陈之为12月25日表示,为外资参与西部陆海新通道建设提供更加便捷的支付环境
2025-12-26 07:32:00
“手机声音那么大,吵死了!”相信不少市民在乘坐公共交通出行时,都会遇到过此类“烦心事”。“噪音”是否还会对司机驾驶、行车安全带来影响?近日
2025-12-26 07:39:00
钱塘里人 金农回家
作为浙江美术馆跨年大展之一的“山林气象——金农特展”近日盛大开幕,这是该馆近年来继王铎、傅山、何绍基、赵之谦等自主策划实施的“中国传统经典系列”名家特展后的又一大展
2025-12-26 07:09:00
一堂大学色彩课破圈引来13万校内外学习者
从课堂到生活,从理论到体验,欧阳丽莎将美的种子根植于学生心间。 受访者供图“色彩是什么?”在华中师范大学“色彩信息魅力”的第一堂课上
2025-12-26 05:21:00
“傻瓜车间”
“零号车间”位于西子航空车间最起始处。技术部工作人员谭建平指导硕士生刘琪钳工的基本技能。 “傻瓜车间”里制作的手工铁砧模型
2025-12-26 07:09:00
当文字成为精神的舟楫,那传承至今的风雅文脉,便是一座城市最温润而悠长的呼吸。千年前,宋词在江南烟雨中臻于兴盛;今天,杭州围绕打造“宋词之都”展开系统论证与实践
2025-12-26 06:38:00
日常即文学 年轻人流行“身边写作”
视觉中国供图2025年,年轻人流行“身边写作”,在日常碎片里打捞生活的诗意与重量。“生活中的一些经历引导着写作。”就读于江苏南通一所高校中文师范专业的大三学生张子煜
2025-12-26 05:21:00
翠苑88岁爷爷自筹7万元为老楼装“座椅电梯”
网友关心的效率、安全、维护问题,我们一一问清了翠苑一区88岁的项爷爷和楼下66岁邻居李冬林,奔波20多天,征得整幢楼同意
2025-12-25 14:48:00
带状疱疹疫苗扩龄新适应症正式落地,为济南市年轻高危人群筑牢免疫防线
鲁网12月24日讯(记者 魏萱)重组带状疱疹疫苗获批新适应症后,已在济南落地,标志着泉城在为年轻高危人群筑牢免疫防线、完善全生命周期的免疫保护上迈出了关键一步
2025-12-25 14:53:00
西安理工大学原创话剧讲述“青稞之父”家国情怀
近日,西安理工大学曲江校区图书馆报告厅内座无虚席,由西安理工大学阳光工作室(陕西高校省级辅导员示范工作室)主创的原创话剧《大地之子
2025-12-25 15:07:00
物业保洁员深夜挺身而出 背着患者奔向检查室……
近日,陕西省物业管理协会正式公示2025年度优秀品牌企业评选结果,融通物业管理有限公司陕西分公司凭借在医疗卫生物业领域的深耕细作
2025-12-25 15:07:00
长白时评评论员 唐小兰近日,浙江绍兴,一名女孩小心翼翼端着店家赠送的一杯水走向母亲分享喜悦时,水杯被另一陌生女孩突然故意打翻的事件引发网络热议
2025-12-25 15:10:00