• 我的订阅
  • 社会

GPT-4下岗了,上海高校和企业用DeepSeek开发大模型和智能体

类别:社会 发布时间:2025-01-29 21:29:00 来源:缘之心

深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。

达观数据公司去年5月就引入DeepSeek-V2大模型,开发办公智能体(Agent),取得了很好效果。“DeepSeek的性价比极高,而且全面开源,对产业应用很友好。”达观数据董事长、首席执行官陈运文博士说。

大幅提高办公智能体的专业能力

近年来,赵海团队利用GPT-4等基座大模型,为政府和企业开发了十多个垂类大模型。在开发过程中,基座大模型的主要作用是生成合成数据。这类数据通过人工方式生成,而不是从真实世界中获取,用于训练大模型。“我用过一些国产基座大模型,它们的效果和GPT-4比起来,还是有一定差距。”赵海教授告诉记者,“但使用DeepSeek-V3后,我发现它的性能与GPT-4处于同一量级,而价格只有GPT-4的十分之一,所以现在不用GPT-4了。”

与赵海团队相比,达观数据使用DeepSeek更早。陈运文介绍,DeepSeek-V2是一个精简高效的开源模型,只需要相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。

“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比上一个版本V2.5模型提升3倍,达到每秒吞吐量60token。”陈运文介绍,“V3对GPU资源的使用效率极高,因为很多单位没有庞大的GPU集群,DeepSeek这种低资源、高效果的特性有利于今后大规模推广应用。”

DeepSeek-V3为何对GPU资源的使用效率极高?陈运文解释,它运用了多种技术创新,如采用MLA(多头潜在注意力)架构,成功压缩了键值缓存;使用对偶流水线机制,通过设计流水线调度,让GPU算力和通信算力在训练中并行隐藏,成功减少了计算瓶颈,实现几乎不间断的运算;还使用PTX这一接近汇编语言的低级指令集,对GPU进行细致控制,如调整寄存器分配和线程运行方式,从而更精细地管理GPU资源。

本月发布的推理大模型DeepSeek-R1在复杂的数学和逻辑任务上表现优秀,达观数据使用后,大幅度提升了办公智能体在审阅处理复杂的工程报告、金融文书、财务报表、招投标书等专业文档上的能力。

DeepSeek风靡美国后,投资者抛售人工智能主题相关股票,纳斯达克综合指数1月27日显著下跌。新华社发

R系列模型将推动科学智能发展

“DeepSeek-V3和DeepSeek-R1的问世,是大模型领域的标志性事件。”赵海认为,大模型近年来的发展历程可分为三个阶段:第一阶段的标志性事件是ChatGPT问世,其表现令人惊艳,但因为不开源,大多数开发者并不清楚这个大模型是如何开发出来的;在第二阶段,很多团队重现了ChatGPT开发过程,涌现出Llama、Qwen等一批开源大模型,这类模型的性能越来越强,但与OpenAI发布的大模型相比,存在一定差距;DeepSeek-V3和DeepSeek-R1则开启了第三阶段,它们的性能可分别比肩GPT-4和OpenAI o1,意味着开源大模型终于追赶上了闭源大模型。

这位长期研究自然语言处理的学者说,自从OpenAI在2020年发布不开源的GPT-3以来,这家标榜“从事开放性人工智能研究”的机构就背离了初心。如今,随着深度求索公司的异军突起,大模型研发可谓“回归初心”,让开源再度成为业内的主流形态。通过深度求索发布的技术报告,全球开发者都了中国研发团队的创新智慧。可以预见,DeepSeek将引发大模型创新和产业生态的变革。

未来,DeepSeek的R系列推理大模型最值得关注。赵海解释:“过去,ChatGPT等大模型像文科生,不擅长理科和逻辑推理。而对人类智慧来说,最底层的智慧是逻辑,逻辑之上是数学,再上面是物理、化学等科学。”去年9月,OpenAI发布的o1推理大模型改变了“文科生”形象,它擅长逻辑推理和数学,为今后将大模型用于科学研究、处理复杂任务奠定了基础。

目前,DeepSeek-R1的性能与OpenAI o1不分上下,为中国的科学智能(AI for Science)发展提供了利器。在赵海看来,人工智能这门学科的终点是“人工大脑”问世,这种通用人工智能(AGI)设备可用于研究数学、自然科学、社会科学等各个专业领域的复杂问题。未来20年内,科学家有望开发出“人工大脑”,从而颠覆现有的科研范式,使人类获取新知识和解决方案的效率大幅提升。

深度求索创始人梁文锋近日接受专访时表示,DeepSeek的终极目标是实现通用人工智能,而非仅仅追求商业化应用,“生成式AI只是通往AGI的必经之路,AGI有望在我们有生之年实现”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-30 05:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

司机都下岗的节奏!黄仁勋:未来汽车将全自动驾驶
快科技1月11日消息,对于司机这个岗位来说,以后可能都有没有必要存在了。英伟达CEO黄仁勋在CES展会上表示,到20年后所有汽车都将具备自动驾驶功能。“特别是下一代纯电动汽车(E
2025-01-11 07:51:00
ChatGPT再出“王炸”,客服都要下岗了?
图片来源@视觉中国文|深燃,作者 | 李秋涵,编辑 | 魏佳席卷社交网络的ChatGPT,最近再次向全世界投放了一个“炸弹”
2023-03-04 14:00:00
上海:加速实施“模塑申城”
本文转自:人民网-上海频道人民网记者 董志雯 葛俊俊上海开年首个科技盛会来了!“2025全球开发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人
2025-02-20 15:49:00
共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...25全球开发者先锋大会“语料筑基 智生时代”主题论坛在上海市徐汇区正式拉开帷幕。论坛由全球开发者先锋大会组委会指导,由上海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工
2025-02-23 08:49:00
本文转自:人民日报海外版上海徐汇区大模型产业加速发展人工智能引燃“模都”“语料创新技术与应用探索沙龙活动”“多模态大模型应用研讨会”“AI赋能下的开发流程蜕变”……走进位于徐汇西
2025-02-14 04:50:00
AI上海力量崛起背后:创新生态全要素布局,如何再进一步
DeepSeek卷起的AI浪潮,让上海开年第一场科技峰会:2025全球开发者先锋大会(GDC)热度空前。2025年2月22日
2025-02-25 07:51:00
全球科学智能开发者社区在沪启动:提供从模型到开发的全链路支持
全球科学智能开发者社区在上海正式启动。2月21日至2月23日,以“模塑全球 无限可能”为主题的全球开发者先锋大会(GDC2025)在上海徐汇西岸举办。大批软件开发者、AI(人工智
2025-02-22 22:11:00
2024全球开发者先锋大会在上海盛大开幕,聚焦AI与前沿技术
3月23日,备受瞩目的2024全球开发者先锋大会(GDC)在上海西岸穹顶艺术中心开幕。本次大会以“模速空间——开发者的模力之源”为主题,促进汇聚了众多知名开发者、科技先锋、创客精
2024-03-25 01:44:00
...融产业多维赋能闭环。统一两种人工智能技术思路“我来上海参会前,专门‘询问’了ChatGPT,我在开发者大会上可以说些什么。”主旨演讲中,美国国家工程院外籍院士沈向洋提到了So
2024-03-24 06:24:00
更多关于社会的资讯:
中新经纬2月11日电 据文旅部网站11日消息,《旅游投诉处理办法》(以下简称《办法》)已经2025年12月29日文化和旅游部部务会议审议通过
2026-02-11 20:59:00
【热气腾腾中国年】习言道|老百姓的年货里,藏着习近平“最大的心愿”
中新网2月11日电 题:老百姓的年货里,藏着习近平“最大的心愿”“今天是北方的‘小年’,我特地来同大家一起‘过小年,迎新年’
2026-02-11 21:02:00
大皖新闻讯 2月10日,大皖新闻报道了肥西付梦虹女士一家正经历着猝不及防的打击一事,她的公公和丈夫因病不幸先后离世,大姑子仍在医院救治
2026-02-11 21:13:00
寒假如何不虚度?跟着老师这样“玩”,这个假期悄悄进步
大河网讯(记者 刘高雅)寒假不仅是课程表上的空白页,更可以成为孩子成长的“试验田”。如何在这片自由时光里既留下欢声笑语
2026-02-11 21:24:00
登机前,可“豫”备年货
大河网讯 “在机场就能备齐年货和礼品,回家路上轻松多了。”2月11日,正在郑州机场候机的吴女士分享道,她在机场购买了许多河南特色礼品
2026-02-11 21:24:00
中国网2月11日讯 据“中国海警”微信公众号11日消息,2025年,各级海警机构共查获走私案件464起、偷渡案件129起
2026-02-11 21:43:00
2月11日,陕西省曙光应急救援协会发布讣告称,优秀志愿者、陕西省曙光应急救援协会执行会长付飞同志,因病医治无效,于2月10日晚21时在西安不幸逝世
2026-02-11 22:14:00
寄语东风,旭日蒸霞,马蹄踏响复兴曲;谋篇中部,荆州出彩,燕剪裁新生态图。小年期间,朱红的春联垂挂于荆州古城九座城门之上
2026-02-11 22:26:00
济宁市任城区阜桥街道解放路社区开展“情暖夕阳·守护新春”志愿服务活动
鲁网2月11日讯为切实保障辖区独居老人的生活质量与安全,让老人们在新春佳节来临之际感受到实实在在的温暖与关怀,近日,济宁市任城区阜桥街道解放路社区网格工作中心组织网格员持续开展“情暖夕阳·新春守护”独居老人入户走访行动
2026-02-11 21:54:00
K8205次列车暖心服务高龄旅客 全程护航获称赞
本报讯 2026年2月6日,K8205次列车从西安站始发,车站与列车工作人员联动发力,全程贴心护送两位高龄旅客,妥善解决其出行难题
2026-02-11 21:43:00
“法官,我要还钱!”这名“老赖”在前往西安市拘留所的警车上如梦方醒
“法院,我不去拘留所!我要还钱!我还!”在前往拘留所的警车上,一直抗拒执行的被执行人张桃终于慌了神,表明愿意还款……该案系西安鄠邑法院审理的一起劳务合同纠纷
2026-02-11 22:15:00
戏剧家汤姆斯·理查兹在乌镇开课,“演员技艺与创作计划”报名启动
中国青年报客户端讯(中青报·中青网记者沈杰群)日前,2026“乌镇艺术课堂:汤姆斯·理查兹/戏无界剧团——演员技艺与创作计划”正式启动
2026-02-11 21:43:00
农行临沂临西开源支行:无声的守护,一笔一划间的金融温度
鲁网2月11日讯近日,中国农业银行临沂开源支行大厅里迎来了一位特殊的顾客,一段特殊的服务故事正悄然温暖着大厅里每一位见证者的心
2026-02-11 17:13:00
农行郯城支行营业部:小小零钞显温情,农行服务暖人心
鲁网2月11日讯近日,农行郯城支行营业部以细致入微的服务,为一笔特殊“存款”赋予了温度,赢得了客户的由衷感谢。一位老年客户提着一塑料袋破损严重的人民币来到营业大厅
2026-02-11 17:15:00
农行临沂临西商城支行:暖阳下的无障碍通道,让服务有温度
鲁网2月11日讯“大爷,您扶稳了,咱慢慢下来。”农行临沂临西商城支行大堂经理轻声说道,她小心地调整轮椅的角度,确保轮子与坡道边缘保持安全距离
2026-02-11 17:15:00