• 我的订阅
  • 科技

DeepSeek开源周才第二天 有些公司就已经坐不住了

类别:科技 发布时间:2025-02-26 08:04:00 来源:浅语科技

哥几个,走过路过别错过,今天的 AI 圈可以说是格外热闹了。

真正 “Open” 的 DeepSeek ,打出开源周的第二发炮弹,短短几个小时就已经在 GitHub 上,收获了 3k 多星。

“ 开源老兵 ” 阿里通义千问也没闲着,推出了 QwQ-Max-Preview 深度思考模型,展示思维链,还支持联网搜索。

还有凌晨两点多,大伙儿可能还在做梦的时候,大洋彼岸的 Anthropic 也给模型升级换代了。号称他们迄今为止最聪明的 Claude 3.7 Sonnet ,还是个推理模型和传统模型的 “ 混血 ” 。

DeepSeek开源周才第二天 有些公司就已经坐不住了

我估计今天那些专门做模型测评的博主,都快要忙不过来了吧。。。

再加上 Grok 3 、 DeepSeek R1 、 o3 mini ,世超猜到了今年推理模型必有一战,但没想到,来得这么快。

光这么说大伙儿估计也没感受,今天咱们就挨个来看看, AI 圈子到底是怎么个热闹法。

先把视线,放在新一代 “ 开源战神 ” DeepSeek 身上。

用 R1 教育了一遍市场之后, DeepSeek 这两天,干脆开源了个彻底, 5 天时间,每天发一个代码库。

第一天,整了个 FlashMLA ,这玩意儿专门针对英伟达的 Hoppers GPU ( 比如 H100 、 H800 ),进行了效率优化,通俗点说就是榨干 GPU 的最后一滴性能。

DeepSeek开源周才第二天 有些公司就已经坐不住了

今天开源的,则是 DeepEP 通信库。

根据官方的介绍,这是一个专门为专家混合( MoE )和专家并行( EP )设计的通信库。太复杂的咱也不去深究,大白话就是通信库可以让 “ 专家们 ” 的交流更快速、高效。

盲猜一波,国内那些个手里有 Hoppers GPU ,还是研究 MOE 模型的 AI 公司,可能已经冲了。

不知道明天 DeepSeek 又会开源哪个代码库,但光凭他们这敞亮、真诚的态度,圈粉就是分分钟的事儿,在 DeepSeek 的评论区底下,世超已经看到不只一位老哥,对着 OpenAI 贴脸开大了。

DeepSeek开源周才第二天 有些公司就已经坐不住了

不过说到这,可能会有差友疑惑,网上整天嚷嚷着开源,这跟咱到底有啥关系?

这么说吧, DeepSeek R1 开源以后,大大小小的私企、国企都吻了上来,还有高校甚至政府机关,不是已经接入 DeepSeek ,就是在接入的路上。

经过大规模的模型部署后,下一步就是生态的构建、产业的融合,就像当年的 “ 互联网 +” , AI 同样也可以成为基础设施,融入到咱们生活的方方面面。

很难说,闭源模型在构建生态这一步,能不能在短时间内达到像 DeepSeek 这样的效果。

所以这一切,我们可能都得感谢开源。

DeepSeek开源周才第二天 有些公司就已经坐不住了

再来看阿里通义千问的 QwQ-Max-Preview ,是个推理模型。阿里也算是国内第一个,推出推理模型的头部大厂。

根据官方的说法,这是一个基于 Qwen2.5-Max 的推理模型,有很强的数学理解、编码能力,但目前还只是预览版。

世超在第一时间简单试了试, QwQ 也有思维链的展示。(不得不说,QwQ这名字有点可爱。。)

DeepSeek开源周才第二天 有些公司就已经坐不住了

问它一道数学竞赛真题,最后的答案倒是对了,就是思考时间稍微久了些,我粗略估计思考了得有两分钟出头。

DeepSeek开源周才第二天 有些公司就已经坐不住了

这道题问 DeepSeek R1 ,它的思考过程跟 QwQ 很相似,也是分析了多种可能性,但 R1 胜在推理的速度稍微快一些( 112 秒 )。

而同样的题目,我又问了今天的另外一位主角 Claude 3.7 Sonnet 。

只能说,又快又准。

DeepSeek开源周才第二天 有些公司就已经坐不住了

但值得注意的是, Claude 3.7 Sonnet 是个混合模型,一个模型有标准和扩展两种模式。

如果你想看到大模型的推理步骤、思考过程,那就得选扩展模式。

DeepSeek开源周才第二天 有些公司就已经坐不住了

如大伙儿所见,体验 Claude 3.7 Sonnet 的推理能力,是另外的价格。

DeepSeek开源周才第二天 有些公司就已经坐不住了

世超还找了几个外网的实测案例,发现 Claude 的代码能力依然强得可怕。

同一组提示词喂给 Claude 3.7 Sonnet 和 Grok 3 ,这是 Claude 3.7 Sonnet 的结果。

DeepSeek开源周才第二天 有些公司就已经坐不住了

再来看 Grok 3 的,直接被碾压。

DeepSeek开源周才第二天 有些公司就已经坐不住了

即使 DeepSeek 加入战斗,也被秒了。。。

DeepSeek开源周才第二天 有些公司就已经坐不住了

反正看下来, AI 发展到今天,已经有点超乎世超的想象了。

虽说今天这三则新闻放一起,打眼一看,好像没啥特别大的关联。

但稍微一提炼你就会发现,它们恰好体现了当前人工智能发展的趋势:开源阵营不断壮大,推理模型成为主流。

模型的开源和闭源之争, DeepSeek 一出手,即便是奥特曼,也不得不亲口承认, OpenAI 的闭源策略 “ 站在了历史错误的一边 ” 。

DeepSeek开源周才第二天 有些公司就已经坐不住了

像 Llama 家族这种具有里程碑意义的模型,对于开源社区的重要性无需多言。

而除了 DeepSeek 和 Meta ,阿里通义千问、 xAI ,还有陆续拥抱开源的百度、 Minimax 和阶跃星辰,开源阵营肉眼可见在壮大。

另外一边,前两年大模型是不是老强调自己的长文本能力,慢慢的开始卷文生图、文生视频还有语音交互这些多模态,再到最近,模型跑分全是数学、代码。

真就应了那句话, AI 一天,人间一年。

照这么下去,可能哪天 OpenAI 宣布开源,又或者谁家突然宣布把 AGI 整出来了,我都不会觉得惊讶了。

责任编辑:随心

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-26 11:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B
2025-03-06 13:22:00
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端
2024-07-18 14:57:00
阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误
...日消息,今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型
2025-01-16 14:56:00
阿里云CTO周靖人:全面投入升级AI大基建
...能力上持续攀升。 作为业内最早布局大模型技术的科技公司之一,去年4月,阿里云发布首个大语言模型通义千问,如今通义大模型家族已全面涵盖语言、图像、视频、音频等全模态,性能均跻
2024-09-19 15:53:00
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...公共云事业部总裁刘伟光表示:“作为中国头部的云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”
2024-05-22 16:18:00
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,
2025-02-21 23:22:00
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...团CEO吴泳铭宣布阿里云重磅升级全栈AI体系,实现从AI大模型到AI基础设施的技术更新。面向新一轮智能革命,阿里云将全力打造成为全栈人工智能服务商。AI时代,大模型将是下一代
2025-09-24 13:30:00
吴泳铭官宣3800亿投入后,阿里云如何打AI这场硬仗?
...则让这把火烧得更旺了。OpenAI CEO山姆·奥特曼近日宣布,公司计划在未来几周内发布新的推理模型o3和o4-mini
2025-04-10 17:12:00
大模型下探音视频AI市场,战争才刚刚开始 | ToB产业观察
...备软硬件能力的服务商外,飞书妙记、腾讯会议等互联网公司孵化的企业办公生产力工具,也同样具备相似的能力。可能的区别在于,背后的AI技术逻辑,是否会因大模型的到来而彻底改变。科大
2023-06-07 14:00:00
更多关于科技的资讯:
张宣科技:科技驱动打造绿色低碳新能源标杆
图为张宣科技技术骨干正在对水系统设备进行全面巡视检查。于飞摄河北新闻网讯(王杨、马薇)打造全球领先的绿氢绿能耦合冶金示范
2026-01-20 17:17:00
聚焦临沂两会」临沂市政协委员许金龙:以科技创新引领标志性产业链高质量发展
鲁网1月20日讯“抢抓人工智能战略风口,以科技创新为核心引擎赋能产业升级,推动我市标志性产业链向高端化、智能化、绿色化方向提质进阶
2026-01-20 17:23:00
中国消费者报北京讯(记者裴莹)1月19日,荣耀与泡泡玛特合作推出的“荣耀500 Pro MOLLY 20周年限定版”手机正式发布
2026-01-20 17:30:00
中国消费者报北京讯(记者孙蔚)近日,转转集团发布《2025二手消费年度洞察》(以下简称报告)。报告显示,05后成为二手消费新生力量
2026-01-20 17:30:00
中国消费者报北京讯(记者桑雪骐)1月19日,海信召开2026 RGB-Mini LED影游旗舰E8S新品发布会,正式推出影游旗舰E8S系列电视
2026-01-20 17:30:00
春节将至 在中国空间站怎么吃年夜饭?
中国消费者报报道(记者桑雪骐)航天员的手指轻轻按下一个特制设备的启动键,28分钟后,伴随着设备上的按键灯闪烁,取出的不是常见的复热食品袋
2026-01-20 18:00:00
大皖新闻讯 1月20日,记者从阜阳市商业局获悉,为全力推动“超级皖”美食争霸赛半决赛活动氛围,该市将发放60万元消费券
2026-01-20 18:14:00
宜兴市徐舍镇:厚植沃土育“小巨人”
近年来,徐舍镇持续优化营商环境,强化政策引导与服务保障,积极构建富有活力的产业生态,通过搭建产学研对接桥梁,推动技术、人才
2026-01-20 18:52:00
空降社渚!KFC&必胜客“双子星”来了,常州首家
社渚喜讯!常州首对餐饮“双子星”——肯德基与必胜客,即将同步落户社渚!二月初,开业倒计时正式启动,快乐进入双倍时代。从此小镇生活添了新滋味
2026-01-20 18:54:00
中新经纬1月20日电 19日,小红书正式上线《社区公约2.0》,在延续“真诚分享,友好互动”社区价值观的基础上,明确提出“反对制造对立”的倡导
2026-01-20 19:14:00
打造复合生活空间,应对多元业态挑战!石家庄本土超市加速向体验化、社区化转型
1月16日上午9时,刚刚开业的石家庄北国超市青园店客流如织。经历了永辉闭店、北国接手后,经过30天左右的装修筹备,该店如今以全新面貌亮相
2026-01-20 19:39:00
从技术突破到产业落地:见证国器传感的量子征程
在工业4.0浪潮席卷全球的今天,传感器作为智能制造的核心元件,其技术突破与产业升级已成为衡量国家工业竞争力的重要标尺。这场没有硝烟的科技博弈中
2026-01-20 19:53:00
第17期监制:杨春红制作:王金顺记者:牛思家
2026-01-20 16:59:00
黄桥街道举办“智启AI:与机器人对话初体验”科普宣传活动
江南时报讯 为了让科学的种子在下一代心中萌芽,让抽象的技术原理转化为可触可感的亲身经历,近日,苏州市相城区黄桥街道举办“智启AI
2026-01-20 17:05:00