• 我的订阅
  • 头条热搜
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
最近一段时间,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
LLM破局泛化诊断难题,MSSP刊登北航PHM实验室健康管理大模型研究
...P)在线发表刊登北航 PHM 团队最新研究成果:基于大语言模型的轴承故障诊断框架(LLM-based Framework for Bearing Fault Diagnosis)。这是北航 PHM 实验室在健康管理大模型领域的成功尝试,研究团队提出了基于大语言模型的轴承故障诊...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...分认识并认可了表征学习的重要性,那么视觉领域的生成模型呢?最近,谢赛宁团队发表的一篇研究就拿出了非常有力的证据:Representation matters!扩散模型如何突破瓶颈? 成本高又难训练的DiT/SiT模型如何提升效率?对于这个问...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
作者:赖文昕编辑:陈彩娴2024 年已经过半,大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。过去短短 2 个月以来,全球 AI 界接连开展了数十场发布会,从海外的英伟达、OpenAI...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...得CoTracker在FastCapture数据集测试中表现出色,超越了众多模型,包括Meta自家的DINOv2。CoTracker的部署也相对简便,用户可以通过Colab版本或从GitHub Repo中获取相关代码和依赖来自行操作。这一开源工具的广泛应用前景令人激动,它...……更多
图结构转文本序列,大模型直接读懂!图推理性能大涨
大语言模型直接理解复杂图结构的新方法来了:将图(Graph)转换为适合Transformer架构的线性token序列。belike:这种最新图线性化方法,反映了自然语言中局部依赖性和全局对齐性两个关键属性,即:不仅需要保留基于前文上下...……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...,高通公司宣布和智谱、腾讯混元合作,共同推动端侧AI模型部署和落地。骁龙8至尊版芯片AI性能HexagonNPU融合了包含标量(scalar)、向量(vector)和张量(tensor)等AI加速器架构,支持INT4、INT8、INT16和FP16精度,能够利用大型语...……更多
遗憾不?百度早研究过Scaling Law,Anthropic CEO灵感都来自百度
...Scaling Law 的相关研究,并且通过实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可预测的幂律 scaling 关系。只是,他们当时用的是 LSTM,而非 Transformer,也没有将相关发现命名为「Scaling Law」...……更多
苹果称ReALM模型比GPT-4更强:能让Siri变得聪明
...过在AI时代,苹果似乎落后其他厂商不少,特别是大语言模型更是苹果的弱项,在其他厂商都如火如荼推广自家的AI模型的时候,苹果似乎还在内部评估,距离正式商用还有很长的路要走。不过苹果却表示自家的ReALM模型的性能表...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
5月6日 记者获悉,国内权威的大模型评测机构SuperCLUE最新发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是...……更多
新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
...领域正在经历重大转型,从传统的「单一数据集训练单一模型」的模式逐步转向「通用预测基础模型」。目前虽然有不少基础模型已经提出,但如何有效地在高度多样化的时序数据上训练基础模型仍是一个开放问题。近期,来自...……更多
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...蒸馏这一概念,能在保证准确率接近的情况下,大幅压缩模型参数量,让模型能够部署在各种资源受限的环境。比如Siri能够出现在手机上,就是用知识蒸馏压缩语音模型。自它之后,大模型用各种方法提高性能上限,再蒸馏到...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
发布不到1周,OpenAI最强模型o1的护城河已经没有了。有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河这项研究表明,增加测试...……更多
联想发布DeepSeek一体机解决方案:支持千亿参数大模型训练
...2月6日消息,联想集团与沐曦股份联合发布基于DeepSeek大模型的一体机解决方案。该方案以“联想服务器/工作站+沐曦训推一体GPU+自主算法”为核心架构,配合联想AI force智能体开发平台,推出智能体一体机与训推一体服务器双产...……更多
DeepSeek开源惠四方(科技名家笔谈)
...州深度求索人工智能基础技术研究有限公司推出AI语言大模型DeepSeek,受到用户热烈欢迎。2025年1月20日,DeepSeek-R1发布上线,7天内用户超过1亿。ChatGPT从发布到达到相同的用户规模用时两个月。GitHub是全球最大的代码托管网站,Gi...……更多
AIGC风潮席卷手机:但在PC面前 还是个弟弟
...方面,对于AI而言,最基础的前提一是算力是否够强大、模型和算法是否够丰富,二就是应用场景是否够广泛、灵活。无需赘言,手机和PC相比无论CPU性能还是GPU性能,根本不在一个档次,即便加入独立的AI引擎,也是看不见尾灯...……更多
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...AI Open Day正式举办。在现场,智谱AI发布了全新的开源大模型GLM-4系列、新API模型、MaaS 2.0大模型开放平台、智能体等等产品。5月的大模型“大促月”还没结束,智谱也再度跟进降价。比如,GLM-4-Flash轻量化版本,在企业优惠价下...……更多
专访面壁智能:大模型仍处于技术发展期,只做应用放弃模型迭代很危险
大模型落地应用元年③:2023,随着ChatGPT的横空出世,大模型迎来了前所未有的关注。2024,业内普遍认为,大模型将迎来落地应用热潮。大模型落地应用元年,人工智能技术也行至产业应用的临界点。红星资本局采访多家国内...……更多
边缘大模型狂飙落地!清华系GPGPU惊艳WAIC,解读“六边形战士”处理器
...第七届世界人工智能大会(WAIC 2024)开幕,展区已成“大模型”主场,各路玩家隔空斗法。既有闻名业界的通用大模型大秀生成、理解能力,在金融、医疗等诸多领域施展拳脚的行业大模型,还有能直接部署在PC、服务器等边缘...……更多
深中通道通车在即,探秘“超级隧道”背后的“超级配方”
...四航研究院自2015年开始,历时4年艰辛探索,经历了缩尺模型、浮态浇筑、足尺模型和模拟浇筑等系列试验,在2019年终于配制出钢壳沉管浇筑工艺的自密实混凝土“超级配方”,有力保障了深中通道钢壳混凝土沉管的顺利浇筑,...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...张建中抛出一句掷地有声的断言。为什么必须是万卡?大模型行业变化很快,客户希望两周内结束战斗,最迟也得在1个月内训练完。假设训练一个5000亿参数模型,有15TB数据,如果只有1000P算力,3年都训不完;如果将时间锁到两...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...互能力将是未来数字人发展的重要方向。 腾讯混元大模型赋能AIGC应用落地 推进产业智能化升级 腾讯云大模型产品专家屈蕾 腾讯混元大模型历经迭代日趋成熟,坚持全链路自主研发技术,支持众多场景的创新应用,实现技...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
单卡搞定Llama 3.1 405B,让大模型轻松瘦身!超强压缩工具包来了
单卡搞定Llama 3.1(405B),最新大模型压缩工具来了!最近Llama-3.1登上开源顶峰,但其最强的405B版本模型900多GB的内存需求,对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC,能...……更多
2025开年 黄仁勋扔出一串王炸
...伟达来说,今晚需要登台的主角不止一位。包括世界基础模型Cosmo、“掌上AI超算”Project Digits也完成首次亮相。在2025年开年,英伟达扔出了一串“王炸”。“等等党”的大胜利黄仁勋素以“刀法精湛”而闻名,但这次发布会上...……更多
vivo开发者大会,originos4流畅好用
...新的OriginOS4系统在本次发布会中亮相。OriginOS4集成蓝心大模型,更智慧,让手机成为你的专属私人助理;同时搭载虚拟显卡、异构计算空间等技术,更流畅,从丝滑轻盈到舒适愉悦。还拥有全链路会议助手、离库导航优化等功能...……更多
面壁智能完成数亿融资,CEO:大模型进入真刀真枪比拼阶段
...财务顾问。对于新一轮融资,面壁智能CEO李大海表示,大模型正在开始进入“真刀真枪”的比拼阶段,从“大跃进”转向“持久战”。新一轮融资完成后,面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局,以同等...……更多
更多关于科技的资讯:
关育兵近日,抖音博主“@爱吃蛋”凭借精确到秒的煮蛋教程,8天时间涨粉356万,被称为“蛋神”“煮蛋仙人”。最初,一名抖音用户分享“爸爸做出的完美水煮蛋”
2025-12-15 11:25:00
部分热门款式甚至卖断货 雪具市场迎“冬”风 国货订单激增
商报讯 随着入冬滑雪季的开启,多家雪场已经陆续“开板”迎客,滑雪装备市场也在悄然升温。国产雪具品牌凭借高性价比、差异化的设计及国潮元素融合等优势
2025-12-15 11:36:00
能源行业最大年度演讲在青岛举办 解码能源行业发展新趋势
12月10日至12日,“进化的能源·马一峰年度演讲2026”暨第21期综合能碳培训资源链接大会在青岛举行。作为能源行业最大的年度演讲和极具影响力的生态盛会
2025-12-15 11:55:00
厦门网讯(厦门日报记者 林露虹)厦门企业海辰储能聚焦长时储能,推出三大突破性的创新解决方案,以破解新能源消纳难题,满足AIDC(人工智能数据中心)能源转型需要
2025-12-15 08:58:00
“眼”观未来“镜”显风采 厦门眼镜产业发力新赛道
连续多年举办的厦门眼镜展。(厦门日报记者 王元晖 摄)艾普光学生产线。(资料图/厦门日报记者 林铭鸿 摄)嘉宾在厦门眼镜展上体验智能眼镜
2025-12-15 08:58:00
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知当AI成为信息分发的核心枢纽,企业却陷入前所未有的传播困境
2025-12-15 09:25:00
影视AI赛道再添强援 长江电影智象未来联合实验室挂牌 打开商业化想象空间
2025年12月11日,湖北长江电影集团与智象未来在武汉正式揭牌成立“长江电影智象未来影视AI联合实验室”,双方同步签订战略合作协议
2025-12-15 09:55:00
从古典中读懂未来:一位小提琴演奏者的“琴弓革命”
在不少人眼中,王辰翔的成长轨迹几乎是古典音乐领域的“标准答案”:四岁半拿起小提琴,少年时期便师从名家;先后进入中央音乐学院附小
2025-12-15 10:25:00
山东移动阳谷分公司助力酒店实现数字化升级
鲁网12月12日讯近日,山东移动阳谷分公司为汉庭酒店西汉庄店量身打造一体化通信解决方案,全面赋能酒店数字化转型升级。通过精准对接酒店在网络带宽
2025-12-15 09:49:00
每集2分钟、一共28集,短剧《昭世录》在美国、英国、泰国等地的短视频平台上线后爆火,海外播放量近2亿。这部短剧由位于嘉兴经开区的嘉兴九州文化传媒有限公司出品
2025-12-15 07:32:00
12月11日,金华市蓝海光电技术有限公司激光雷达事业部总经理刘崇求向记者展示了一款新型机器人导航激光雷达。该雷达除了能360度平面扫描探测
2025-12-15 07:32:00
12月14日,首届全国独角兽企业大赛总决赛在宁波高新区收官。本次总决赛由工业和信息化部火炬高技术产业开发中心、中国电子学会
2025-12-15 07:32:00
12月12日下午,“2025浙江省新消费创新大赛资源对接活动”在杭州余杭未来科技城举办。活动以“潮起新消费 智汇浙未来”为主题
2025-12-15 07:32:00
“亲,这个问题难倒我了”“对不起,我理解不了您的意思”……这些出自AI客服的经典“名言”你熟悉吗?你是不是也被AI客服“逼疯”过呢?随着年终消费季的到来
2025-12-15 07:50:00
杭州故事,叩开世界的“心门”
在中国美术学院举办的“黑神话:悟空”艺术展。记者 步恩撒 摄踏上取经路,比抵达灵山更重要——黑神话:悟空。来西游神话当一回“天命人”
2025-12-15 08:03:00