• 我的订阅
  • 社会

GPT-4下岗了,上海高校和企业用DeepSeek开发大模型和智能体

类别:社会 发布时间:2025-01-29 21:29:00 来源:缘之心

深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。

达观数据公司去年5月就引入DeepSeek-V2大模型,开发办公智能体(Agent),取得了很好效果。“DeepSeek的性价比极高,而且全面开源,对产业应用很友好。”达观数据董事长、首席执行官陈运文博士说。

大幅提高办公智能体的专业能力

近年来,赵海团队利用GPT-4等基座大模型,为政府和企业开发了十多个垂类大模型。在开发过程中,基座大模型的主要作用是生成合成数据。这类数据通过人工方式生成,而不是从真实世界中获取,用于训练大模型。“我用过一些国产基座大模型,它们的效果和GPT-4比起来,还是有一定差距。”赵海教授告诉记者,“但使用DeepSeek-V3后,我发现它的性能与GPT-4处于同一量级,而价格只有GPT-4的十分之一,所以现在不用GPT-4了。”

与赵海团队相比,达观数据使用DeepSeek更早。陈运文介绍,DeepSeek-V2是一个精简高效的开源模型,只需要相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。

“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比上一个版本V2.5模型提升3倍,达到每秒吞吐量60token。”陈运文介绍,“V3对GPU资源的使用效率极高,因为很多单位没有庞大的GPU集群,DeepSeek这种低资源、高效果的特性有利于今后大规模推广应用。”

DeepSeek-V3为何对GPU资源的使用效率极高?陈运文解释,它运用了多种技术创新,如采用MLA(多头潜在注意力)架构,成功压缩了键值缓存;使用对偶流水线机制,通过设计流水线调度,让GPU算力和通信算力在训练中并行隐藏,成功减少了计算瓶颈,实现几乎不间断的运算;还使用PTX这一接近汇编语言的低级指令集,对GPU进行细致控制,如调整寄存器分配和线程运行方式,从而更精细地管理GPU资源。

本月发布的推理大模型DeepSeek-R1在复杂的数学和逻辑任务上表现优秀,达观数据使用后,大幅度提升了办公智能体在审阅处理复杂的工程报告、金融文书、财务报表、招投标书等专业文档上的能力。

DeepSeek风靡美国后,投资者抛售人工智能主题相关股票,纳斯达克综合指数1月27日显著下跌。新华社发

R系列模型将推动科学智能发展

“DeepSeek-V3和DeepSeek-R1的问世,是大模型领域的标志性事件。”赵海认为,大模型近年来的发展历程可分为三个阶段:第一阶段的标志性事件是ChatGPT问世,其表现令人惊艳,但因为不开源,大多数开发者并不清楚这个大模型是如何开发出来的;在第二阶段,很多团队重现了ChatGPT开发过程,涌现出Llama、Qwen等一批开源大模型,这类模型的性能越来越强,但与OpenAI发布的大模型相比,存在一定差距;DeepSeek-V3和DeepSeek-R1则开启了第三阶段,它们的性能可分别比肩GPT-4和OpenAI o1,意味着开源大模型终于追赶上了闭源大模型。

这位长期研究自然语言处理的学者说,自从OpenAI在2020年发布不开源的GPT-3以来,这家标榜“从事开放性人工智能研究”的机构就背离了初心。如今,随着深度求索公司的异军突起,大模型研发可谓“回归初心”,让开源再度成为业内的主流形态。通过深度求索发布的技术报告,全球开发者都了中国研发团队的创新智慧。可以预见,DeepSeek将引发大模型创新和产业生态的变革。

未来,DeepSeek的R系列推理大模型最值得关注。赵海解释:“过去,ChatGPT等大模型像文科生,不擅长理科和逻辑推理。而对人类智慧来说,最底层的智慧是逻辑,逻辑之上是数学,再上面是物理、化学等科学。”去年9月,OpenAI发布的o1推理大模型改变了“文科生”形象,它擅长逻辑推理和数学,为今后将大模型用于科学研究、处理复杂任务奠定了基础。

目前,DeepSeek-R1的性能与OpenAI o1不分上下,为中国的科学智能(AI for Science)发展提供了利器。在赵海看来,人工智能这门学科的终点是“人工大脑”问世,这种通用人工智能(AGI)设备可用于研究数学、自然科学、社会科学等各个专业领域的复杂问题。未来20年内,科学家有望开发出“人工大脑”,从而颠覆现有的科研范式,使人类获取新知识和解决方案的效率大幅提升。

深度求索创始人梁文锋近日接受专访时表示,DeepSeek的终极目标是实现通用人工智能,而非仅仅追求商业化应用,“生成式AI只是通往AGI的必经之路,AGI有望在我们有生之年实现”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-30 05:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

上海:加速实施“模塑申城”
本文转自:人民网-上海频道人民网记者 董志雯 葛俊俊上海开年首个科技盛会来了!“2025全球开发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人
2025-02-20 15:49:00
ChatGPT再出“王炸”,客服都要下岗了?
图片来源@视觉中国文|深燃,作者 | 李秋涵,编辑 | 魏佳席卷社交网络的ChatGPT,最近再次向全世界投放了一个“炸弹”
2023-03-04 14:00:00
司机都下岗的节奏!黄仁勋:未来汽车将全自动驾驶
快科技1月11日消息,对于司机这个岗位来说,以后可能都有没有必要存在了。英伟达CEO黄仁勋在CES展会上表示,到20年后所有汽车都将具备自动驾驶功能。“特别是下一代纯电动汽车(E
2025-01-11 07:51:00
共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...25全球开发者先锋大会“语料筑基 智生时代”主题论坛在上海市徐汇区正式拉开帷幕。论坛由全球开发者先锋大会组委会指导,由上海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工
2025-02-23 08:49:00
本文转自:人民日报海外版上海徐汇区大模型产业加速发展人工智能引燃“模都”“语料创新技术与应用探索沙龙活动”“多模态大模型应用研讨会”“AI赋能下的开发流程蜕变”……走进位于徐汇西
2025-02-14 04:50:00
AI上海力量崛起背后:创新生态全要素布局,如何再进一步
DeepSeek卷起的AI浪潮,让上海开年第一场科技峰会:2025全球开发者先锋大会(GDC)热度空前。2025年2月22日
2025-02-25 07:51:00
全球科学智能开发者社区在沪启动:提供从模型到开发的全链路支持
全球科学智能开发者社区在上海正式启动。2月21日至2月23日,以“模塑全球 无限可能”为主题的全球开发者先锋大会(GDC2025)在上海徐汇西岸举办。大批软件开发者、AI(人工智
2025-02-22 22:11:00
2024全球开发者先锋大会在上海盛大开幕,聚焦AI与前沿技术
3月23日,备受瞩目的2024全球开发者先锋大会(GDC)在上海西岸穹顶艺术中心开幕。本次大会以“模速空间——开发者的模力之源”为主题,促进汇聚了众多知名开发者、科技先锋、创客精
2024-03-25 01:44:00
...融产业多维赋能闭环。统一两种人工智能技术思路“我来上海参会前,专门‘询问’了ChatGPT,我在开发者大会上可以说些什么。”主旨演讲中,美国国家工程院外籍院士沈向洋提到了So
2024-03-24 06:24:00
更多关于社会的资讯:
末班车的暖心停靠:公交司机助力迷路老人团圆
10月12日,太原公交三公司接到市民来电称赞863路公交车驾驶员武晓东在中秋夜末班车时段送老人回家。10月6日21时许
2025-10-12 18:30:00
大皖新闻讯 10月11日,钟世镇院士办公室发布的一则严正声明引发关注。声明指出,钟院士百岁生日时被冒充学生的杨炯等五人纠缠拍摄了大量的合影和视频
2025-10-12 18:43:00
连日阴雨导致多地出现泥泞湿滑路段,给居民出行带来不便。为防范高龄、独居老人发生意外,不少网格员主动作为,凭借对辖区情况的熟悉
2025-10-12 19:01:00
社区八旬空巢残疾老人,将自己的补助卡丢失,又因大雨无法出门补办,非常着急。发现该情况后,社区网格员主动帮忙,协调银行打破常规
2025-10-12 19:01:00
楼上住户为改善屋内采光,私自扩大窗户面积,导致楼下居民心里发慌,遂向社区反映情况。10月11日,坞西社区网格员与社区城建事务工作人员入户调解
2025-10-12 19:01:00
10月11日,中国残疾人就业服务平台发布公告,太原市残联拟补充招聘12名公益性岗位残疾人工作协管员,以帮助就业困难人员实现就业
2025-10-12 19:01:00
男子杨某嗜好网络赌博,且屡赌屡输。为了“挣钱”,他铤而走险充当“车手”,为电信网络诈骗分子转移现金。10月12日,公安杏花岭分局通报
2025-10-12 19:02:00
贵州多地上榜途牛《2025国庆中秋旅游消费盘点》榜单
国庆加中秋8天假期落下帷幕,途牛旅游网发布的《2025国庆中秋旅游消费盘点》数据显示,今年国庆中秋假期,途牛用户出游人次较去年同期呈两位数增长
2025-10-12 19:08:00
热血逐梦展风采 新华保险滨州中支获金融系统篮球赛小组亚军
近日,在滨州市金融系统篮球赛圆满落幕小组赛阶段的激烈角逐中,新华保险滨州中支篮球队凭借顽强拼搏的斗志与默契高效的配合,成功斩获小组第二名的成绩
2025-10-12 19:15:00
大皖新闻讯 中国地震台网正式测定:10月12日15时21分在四川雅安市芦山县(北纬30.48度,东经103.09度)发生4
2025-10-12 19:16:00
阜南女护士与丈夫街头救人!事后发现被救者是女护士小学同学
大皖新闻讯 这几天,一段阜南县城街头女子跪地救人的视频刷爆朋友圈。目前男子转危为安,回家静养。10月11日晚,记者联系到当事人
2025-10-12 19:17:00
以“执著、利人、积善、感恩”的经营哲学 从“小作坊”到“大集团”跨越——青岛华森汽车经贸集团以“做人之道”铸就汽车服务传奇
鲁网10月12日讯(记者 马超群 通讯员 宗绪昌 张松文)33载砥砺奋进,汽车经贸续写华章。从1992年租赁濒临倒闭的小汽修厂起步
2025-10-12 19:31:00
无抵押、低利息,轻松办贷款……娄烦人吕先生受网上信息影响,掉入网贷诈骗陷阱,被骗走2.7万余元。10月12日,娄烦县公安局以案释法
2025-10-12 19:32:00
驾驶人薛某,临近高速公路匝道口,才将车停在行车道内查看导航以确定是否走错了路,结果因为在高速公路违停,受到相应处罚。10月12日
2025-10-12 19:32:00
起凤街铁路宿舍9号楼的刘先生,因脑梗行动不便,在身份证即将到期之际,遇上办证难题。在他犯愁之际,起凤街社区网格员与派出所民警提供上门服务
2025-10-12 19:33:00