• 我的订阅
  • 社会

GPT-4下岗了,上海高校和企业用DeepSeek开发大模型和智能体

类别:社会 发布时间:2025-01-29 21:29:00 来源:缘之心

深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。

达观数据公司去年5月就引入DeepSeek-V2大模型,开发办公智能体(Agent),取得了很好效果。“DeepSeek的性价比极高,而且全面开源,对产业应用很友好。”达观数据董事长、首席执行官陈运文博士说。

大幅提高办公智能体的专业能力

近年来,赵海团队利用GPT-4等基座大模型,为政府和企业开发了十多个垂类大模型。在开发过程中,基座大模型的主要作用是生成合成数据。这类数据通过人工方式生成,而不是从真实世界中获取,用于训练大模型。“我用过一些国产基座大模型,它们的效果和GPT-4比起来,还是有一定差距。”赵海教授告诉记者,“但使用DeepSeek-V3后,我发现它的性能与GPT-4处于同一量级,而价格只有GPT-4的十分之一,所以现在不用GPT-4了。”

与赵海团队相比,达观数据使用DeepSeek更早。陈运文介绍,DeepSeek-V2是一个精简高效的开源模型,只需要相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。

“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比上一个版本V2.5模型提升3倍,达到每秒吞吐量60token。”陈运文介绍,“V3对GPU资源的使用效率极高,因为很多单位没有庞大的GPU集群,DeepSeek这种低资源、高效果的特性有利于今后大规模推广应用。”

DeepSeek-V3为何对GPU资源的使用效率极高?陈运文解释,它运用了多种技术创新,如采用MLA(多头潜在注意力)架构,成功压缩了键值缓存;使用对偶流水线机制,通过设计流水线调度,让GPU算力和通信算力在训练中并行隐藏,成功减少了计算瓶颈,实现几乎不间断的运算;还使用PTX这一接近汇编语言的低级指令集,对GPU进行细致控制,如调整寄存器分配和线程运行方式,从而更精细地管理GPU资源。

本月发布的推理大模型DeepSeek-R1在复杂的数学和逻辑任务上表现优秀,达观数据使用后,大幅度提升了办公智能体在审阅处理复杂的工程报告、金融文书、财务报表、招投标书等专业文档上的能力。

DeepSeek风靡美国后,投资者抛售人工智能主题相关股票,纳斯达克综合指数1月27日显著下跌。新华社发

R系列模型将推动科学智能发展

“DeepSeek-V3和DeepSeek-R1的问世,是大模型领域的标志性事件。”赵海认为,大模型近年来的发展历程可分为三个阶段:第一阶段的标志性事件是ChatGPT问世,其表现令人惊艳,但因为不开源,大多数开发者并不清楚这个大模型是如何开发出来的;在第二阶段,很多团队重现了ChatGPT开发过程,涌现出Llama、Qwen等一批开源大模型,这类模型的性能越来越强,但与OpenAI发布的大模型相比,存在一定差距;DeepSeek-V3和DeepSeek-R1则开启了第三阶段,它们的性能可分别比肩GPT-4和OpenAI o1,意味着开源大模型终于追赶上了闭源大模型。

这位长期研究自然语言处理的学者说,自从OpenAI在2020年发布不开源的GPT-3以来,这家标榜“从事开放性人工智能研究”的机构就背离了初心。如今,随着深度求索公司的异军突起,大模型研发可谓“回归初心”,让开源再度成为业内的主流形态。通过深度求索发布的技术报告,全球开发者都了中国研发团队的创新智慧。可以预见,DeepSeek将引发大模型创新和产业生态的变革。

未来,DeepSeek的R系列推理大模型最值得关注。赵海解释:“过去,ChatGPT等大模型像文科生,不擅长理科和逻辑推理。而对人类智慧来说,最底层的智慧是逻辑,逻辑之上是数学,再上面是物理、化学等科学。”去年9月,OpenAI发布的o1推理大模型改变了“文科生”形象,它擅长逻辑推理和数学,为今后将大模型用于科学研究、处理复杂任务奠定了基础。

目前,DeepSeek-R1的性能与OpenAI o1不分上下,为中国的科学智能(AI for Science)发展提供了利器。在赵海看来,人工智能这门学科的终点是“人工大脑”问世,这种通用人工智能(AGI)设备可用于研究数学、自然科学、社会科学等各个专业领域的复杂问题。未来20年内,科学家有望开发出“人工大脑”,从而颠覆现有的科研范式,使人类获取新知识和解决方案的效率大幅提升。

深度求索创始人梁文锋近日接受专访时表示,DeepSeek的终极目标是实现通用人工智能,而非仅仅追求商业化应用,“生成式AI只是通往AGI的必经之路,AGI有望在我们有生之年实现”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-30 05:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

ChatGPT再出“王炸”,客服都要下岗了?
图片来源@视觉中国文|深燃,作者 | 李秋涵,编辑 | 魏佳席卷社交网络的ChatGPT,最近再次向全世界投放了一个“炸弹”
2023-03-04 14:00:00
司机都下岗的节奏!黄仁勋:未来汽车将全自动驾驶
快科技1月11日消息,对于司机这个岗位来说,以后可能都有没有必要存在了。英伟达CEO黄仁勋在CES展会上表示,到20年后所有汽车都将具备自动驾驶功能。“特别是下一代纯电动汽车(E
2025-01-11 07:51:00
上海:加速实施“模塑申城”
本文转自:人民网-上海频道人民网记者 董志雯 葛俊俊上海开年首个科技盛会来了!“2025全球开发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人
2025-02-20 15:49:00
共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...25全球开发者先锋大会“语料筑基 智生时代”主题论坛在上海市徐汇区正式拉开帷幕。论坛由全球开发者先锋大会组委会指导,由上海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工
2025-02-23 08:49:00
本文转自:人民日报海外版上海徐汇区大模型产业加速发展人工智能引燃“模都”“语料创新技术与应用探索沙龙活动”“多模态大模型应用研讨会”“AI赋能下的开发流程蜕变”……走进位于徐汇西
2025-02-14 04:50:00
AI上海力量崛起背后:创新生态全要素布局,如何再进一步
DeepSeek卷起的AI浪潮,让上海开年第一场科技峰会:2025全球开发者先锋大会(GDC)热度空前。2025年2月22日
2025-02-25 07:51:00
全球科学智能开发者社区在沪启动:提供从模型到开发的全链路支持
全球科学智能开发者社区在上海正式启动。2月21日至2月23日,以“模塑全球 无限可能”为主题的全球开发者先锋大会(GDC2025)在上海徐汇西岸举办。大批软件开发者、AI(人工智
2025-02-22 22:11:00
2024全球开发者先锋大会在上海盛大开幕,聚焦AI与前沿技术
3月23日,备受瞩目的2024全球开发者先锋大会(GDC)在上海西岸穹顶艺术中心开幕。本次大会以“模速空间——开发者的模力之源”为主题,促进汇聚了众多知名开发者、科技先锋、创客精
2024-03-25 01:44:00
...融产业多维赋能闭环。统一两种人工智能技术思路“我来上海参会前,专门‘询问’了ChatGPT,我在开发者大会上可以说些什么。”主旨演讲中,美国国家工程院外籍院士沈向洋提到了So
2024-03-24 06:24:00
更多关于社会的资讯:
从骑行西藏到徒步北京,宁国80后用两年旅程治愈自己 收获百万粉丝
大皖新闻讯 为了治疗自己的抑郁症,2024年初,安徽宁国的80后理发师李刚开启了自己的骑行之旅,花一年多的时间,去往西藏
2026-01-21 17:07:00
嫣然天使儿童医院:正在积极推进新址寻找工作,同时也在和房东积极推进沟通
大皖新闻讯 1月21日,北京嫣然天使儿童医院发布声明:近期各类媒体到访,自发捐赠人现场捐赠,合作洽谈者、自媒体作者等来到医院探访及表达关心
2026-01-21 17:11:00
枣庄联通:风雪无阻,服务有温
鲁网1月21日讯(记者 杜方奇)近日,枣庄市持续遭遇低温雨雪冰冻天气,给市民出行与生活带来诸多不便。为确保各营业厅正常运营
2026-01-21 17:22:00
中国消费者报上海讯(记者刘浩)近日,上海市奉贤区市场监管局查处一起网红糖果低俗营销案,经营者以“粑粑糖”“屁屁糖”等低俗元素为卖点吸引未成年人购买
2026-01-21 17:35:00
中国消费者报哈尔滨讯(刘传江 记者李洪涛)1月20日,针对近期不断出现的涉老虚假宣传陷阱,黑龙江省消费者协会发布消费提示
2026-01-21 17:35:00
中国消费者报北京讯(记者孟刚)近日,文化和旅游部与市场监管总局联合发布2026年版团队旅游合同(示范文本),该文本将于2026年3月31日起在全国范围内推行使用
2026-01-21 17:35:00
中国消费者报上海讯(记者刘浩)近日,记者从上海市嘉定区市场监管局获悉,该局成功捣毁一假冒知名品牌乳胶漆的生产窝点,目前已移交公安部门进一步侦办
2026-01-21 17:35:00
瞄准青年受众需求,上海网红美术馆探索AI“即问即答”
中国青年报客户端讯(中青报·中青网记者 王烨捷)走进美术馆,激活“通用解说”或者“亲子解说”语音,就能一边看展一边听讲解
2026-01-21 17:42:00
小叶医探 | 中国科大附一院雪后接诊107名外伤患者 医生紧急提醒
大皖新闻讯 2026年的首场大雪如期而至,由于雪后气温低、道路结冰湿滑,给出行安全埋下了隐患。刚刚,“小叶医探”从中国科大附一院(安徽省立医院)获悉
2026-01-21 17:43:00
连续报道 | 78载漫漫归乡路终抵达 冯大法烈士后人已找到
大皖新闻讯 “大爷,我们找到您了,终于能让您魂归故土了!”2026年1月19日,池州市九华山风景区九华乡桥庵村桥西组村民冯瑞东拿到桥庵村委会开具的亲属关系证明时
2026-01-21 17:43:00
1月18日,省十四届人大常委会第二十次会议表决通过了《陕西省医疗纠纷处理条例》(以下简称《条例》),自2026年6月1日起施行
2026-01-21 17:58:00
大皖新闻讯 2025年11月18日,大皖新闻独家报道了《半小时收费4170元!女大学生网购“上门开锁”遭遇天价账单》一事
2026-01-21 18:54:00
1月21日,陕西省人民政府新闻办公室举办新闻发布会,西安海关副关长李晋生、西安海关统计分析处处长崔颖、西安海关法规和综合业务处处长陈威
2026-01-21 19:01:00
1月21日,据保密观最新披露:谢小米在某市一涉密单位综合办公室工作,平时除了负责单位的文件和档案,还兼着文印室的管理。这天
2026-01-21 19:08:00
济宁市任城区仙营街道秦庄社区:邻里漏水起纠纷,“秦来帮”出手促言和
鲁网1月21日讯“墙面渗水起皮,不仅影响美观,时间长了还担心发霉,这个问题一定要解决!”近日,济宁市任城区仙营街道秦庄社区秦庄小区的居民王大爷遇上了烦心事
2026-01-21 17:58:00