• 我的订阅
  • 社会

GPT-4下岗了,上海高校和企业用DeepSeek开发大模型和智能体

类别:社会 发布时间:2025-01-29 21:29:00 来源:缘之心

深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。

达观数据公司去年5月就引入DeepSeek-V2大模型,开发办公智能体(Agent),取得了很好效果。“DeepSeek的性价比极高,而且全面开源,对产业应用很友好。”达观数据董事长、首席执行官陈运文博士说。

大幅提高办公智能体的专业能力

近年来,赵海团队利用GPT-4等基座大模型,为政府和企业开发了十多个垂类大模型。在开发过程中,基座大模型的主要作用是生成合成数据。这类数据通过人工方式生成,而不是从真实世界中获取,用于训练大模型。“我用过一些国产基座大模型,它们的效果和GPT-4比起来,还是有一定差距。”赵海教授告诉记者,“但使用DeepSeek-V3后,我发现它的性能与GPT-4处于同一量级,而价格只有GPT-4的十分之一,所以现在不用GPT-4了。”

与赵海团队相比,达观数据使用DeepSeek更早。陈运文介绍,DeepSeek-V2是一个精简高效的开源模型,只需要相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。

“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比上一个版本V2.5模型提升3倍,达到每秒吞吐量60token。”陈运文介绍,“V3对GPU资源的使用效率极高,因为很多单位没有庞大的GPU集群,DeepSeek这种低资源、高效果的特性有利于今后大规模推广应用。”

DeepSeek-V3为何对GPU资源的使用效率极高?陈运文解释,它运用了多种技术创新,如采用MLA(多头潜在注意力)架构,成功压缩了键值缓存;使用对偶流水线机制,通过设计流水线调度,让GPU算力和通信算力在训练中并行隐藏,成功减少了计算瓶颈,实现几乎不间断的运算;还使用PTX这一接近汇编语言的低级指令集,对GPU进行细致控制,如调整寄存器分配和线程运行方式,从而更精细地管理GPU资源。

本月发布的推理大模型DeepSeek-R1在复杂的数学和逻辑任务上表现优秀,达观数据使用后,大幅度提升了办公智能体在审阅处理复杂的工程报告、金融文书、财务报表、招投标书等专业文档上的能力。

DeepSeek风靡美国后,投资者抛售人工智能主题相关股票,纳斯达克综合指数1月27日显著下跌。新华社发

R系列模型将推动科学智能发展

“DeepSeek-V3和DeepSeek-R1的问世,是大模型领域的标志性事件。”赵海认为,大模型近年来的发展历程可分为三个阶段:第一阶段的标志性事件是ChatGPT问世,其表现令人惊艳,但因为不开源,大多数开发者并不清楚这个大模型是如何开发出来的;在第二阶段,很多团队重现了ChatGPT开发过程,涌现出Llama、Qwen等一批开源大模型,这类模型的性能越来越强,但与OpenAI发布的大模型相比,存在一定差距;DeepSeek-V3和DeepSeek-R1则开启了第三阶段,它们的性能可分别比肩GPT-4和OpenAI o1,意味着开源大模型终于追赶上了闭源大模型。

这位长期研究自然语言处理的学者说,自从OpenAI在2020年发布不开源的GPT-3以来,这家标榜“从事开放性人工智能研究”的机构就背离了初心。如今,随着深度求索公司的异军突起,大模型研发可谓“回归初心”,让开源再度成为业内的主流形态。通过深度求索发布的技术报告,全球开发者都了中国研发团队的创新智慧。可以预见,DeepSeek将引发大模型创新和产业生态的变革。

未来,DeepSeek的R系列推理大模型最值得关注。赵海解释:“过去,ChatGPT等大模型像文科生,不擅长理科和逻辑推理。而对人类智慧来说,最底层的智慧是逻辑,逻辑之上是数学,再上面是物理、化学等科学。”去年9月,OpenAI发布的o1推理大模型改变了“文科生”形象,它擅长逻辑推理和数学,为今后将大模型用于科学研究、处理复杂任务奠定了基础。

目前,DeepSeek-R1的性能与OpenAI o1不分上下,为中国的科学智能(AI for Science)发展提供了利器。在赵海看来,人工智能这门学科的终点是“人工大脑”问世,这种通用人工智能(AGI)设备可用于研究数学、自然科学、社会科学等各个专业领域的复杂问题。未来20年内,科学家有望开发出“人工大脑”,从而颠覆现有的科研范式,使人类获取新知识和解决方案的效率大幅提升。

深度求索创始人梁文锋近日接受专访时表示,DeepSeek的终极目标是实现通用人工智能,而非仅仅追求商业化应用,“生成式AI只是通往AGI的必经之路,AGI有望在我们有生之年实现”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-30 05:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

司机都下岗的节奏!黄仁勋:未来汽车将全自动驾驶
快科技1月11日消息,对于司机这个岗位来说,以后可能都有没有必要存在了。英伟达CEO黄仁勋在CES展会上表示,到20年后所有汽车都将具备自动驾驶功能。“特别是下一代纯电动汽车(E
2025-01-11 07:51:00
ChatGPT再出“王炸”,客服都要下岗了?
图片来源@视觉中国文|深燃,作者 | 李秋涵,编辑 | 魏佳席卷社交网络的ChatGPT,最近再次向全世界投放了一个“炸弹”
2023-03-04 14:00:00
上海:加速实施“模塑申城”
本文转自:人民网-上海频道人民网记者 董志雯 葛俊俊上海开年首个科技盛会来了!“2025全球开发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人
2025-02-20 15:49:00
共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...25全球开发者先锋大会“语料筑基 智生时代”主题论坛在上海市徐汇区正式拉开帷幕。论坛由全球开发者先锋大会组委会指导,由上海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工
2025-02-23 08:49:00
本文转自:人民日报海外版上海徐汇区大模型产业加速发展人工智能引燃“模都”“语料创新技术与应用探索沙龙活动”“多模态大模型应用研讨会”“AI赋能下的开发流程蜕变”……走进位于徐汇西
2025-02-14 04:50:00
AI上海力量崛起背后:创新生态全要素布局,如何再进一步
DeepSeek卷起的AI浪潮,让上海开年第一场科技峰会:2025全球开发者先锋大会(GDC)热度空前。2025年2月22日
2025-02-25 07:51:00
全球科学智能开发者社区在沪启动:提供从模型到开发的全链路支持
全球科学智能开发者社区在上海正式启动。2月21日至2月23日,以“模塑全球 无限可能”为主题的全球开发者先锋大会(GDC2025)在上海徐汇西岸举办。大批软件开发者、AI(人工智
2025-02-22 22:11:00
2024全球开发者先锋大会在上海盛大开幕,聚焦AI与前沿技术
3月23日,备受瞩目的2024全球开发者先锋大会(GDC)在上海西岸穹顶艺术中心开幕。本次大会以“模速空间——开发者的模力之源”为主题,促进汇聚了众多知名开发者、科技先锋、创客精
2024-03-25 01:44:00
...融产业多维赋能闭环。统一两种人工智能技术思路“我来上海参会前,专门‘询问’了ChatGPT,我在开发者大会上可以说些什么。”主旨演讲中,美国国家工程院外籍院士沈向洋提到了So
2024-03-24 06:24:00
更多关于社会的资讯:
视频摄制:刘冉、张怀琛、赵新宇
2026-03-07 12:27:00
中国青年报客户端讯(中青报·中青网记者李怡蒙)日前,微纪录片《在长沙,都实现》第二季上线。本季节目在延续首季对青年“低成本创业
2026-03-07 13:26:00
免票、半价!杭州及周边多个景区有优惠
随着“三八”国际妇女节临近,浙江及周边省份多个景区纷纷放出大招,推出免票、半价、专属套餐等系列优惠活动,邀广大女性朋友共赴一场春日之约
2026-03-07 12:38:00
我的小家热气腾腾 | 把直播间开在田埂上的“新农人”
大皖新闻讯 1月26日清晨六点,肥西县山南镇小井庄村的天还没大亮,解芹芹就已站在了公司的打包车间里。“过了腊八就是年,这几天订单多得堆成山
2026-03-07 12:11:00
乘风破浪的徽姑娘|“00后”女生开地铁:不枯燥,看着乘客上下车觉得很奇妙
大皖新闻讯 凌晨四点,当整座城市还在沉睡,合肥轨道交通四号线的司机公寓里,刘欣雨的三个闹钟依次响起。“我怕自己听不到闹钟响
2026-03-07 12:13:00
两会,就这Young!丨当AI走进校园,课堂的温度由谁来守护?
编者按:今年全国两会,大河网两位00后记者首次踏上两会征程,以“萌新”视角记录两会,为网友带来全新体验:不背稿、不装样
2026-03-07 12:08:00
还记得去年夏天在国际顶级医学期刊《柳叶刀》上大放异彩的“杭州版减重药”吗?现在,它真的来了。3月6日,由杭州先为达生物科技股份有限公司自主研发的减重药——埃诺格鲁肽注射液(先维盈^[®])正式获国家药品监督管理局批准上市
2026-03-07 08:05:00
记者从深空探测实验室获悉,国际学术期刊《自然·传感》创刊第三期近日以封面文章发表了我国科学家在绘制月球化学成分图方面的重要突破
2026-03-07 08:05:00
AI提示词算作品吗?AI乱答谁负责?专家解读
央视新闻客户端讯 输入几句提示词,AI瞬间就能按照你的指令“画”出一幅精美图片,这样的操作,如今已经越来越普遍。但如果别人照搬了你的“指令”
2026-03-07 08:05:00
央视网消息:3月6日,我国自主设计建设的亚洲最大圆筒型“海上油气工厂”——开平南油田开发项目圆筒型浮式生产储卸油装置在青岛开工建造。
2026-03-07 08:05:00
八段锦、养生茶、艾草泡脚……中医药养生与治疗正成为Z世代新时尚。河北日报纵览新闻两会系列访谈“平行对话·两会内外”第二期
2026-03-07 09:15:00
0.004毫米,是他较劲的数字。在全国人大代表、中国电科网络通信研究院高级技能带头人夏立看来,每一次打磨,都是在和未知对话——他装配的天线
2026-03-07 09:26:00
“报道一出,麻师傅和裁缝铺都成了‘网红’。”最近,杭州西湖区文新街道的通讯员向潮新闻记者反馈道。“别的地方改不了的,来我这准行
2026-03-07 10:07:00
福建省首例涉外器官捐献成功实施马来西亚青年郭迦隽的生命在中国“延续”东南网3月7日讯(福建日报记者 张静雯) 3月6日
2026-03-07 10:35:00
咱们常说“气大伤身”,这可不是句空话。你生的每一次气,都可能“留”在了甲状腺里。今天给大家分享两个动作,睡前做一做,把一天的闷气揉散~01推肝经坐位
2026-03-07 10:37:00