• 我的订阅
  • 头条热搜
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...仁勋发布了一系列重磅技术产品,包括新一代基于Blackwell架构的RTX 50系列显卡、世界上最大最快的巨型芯片Grace Blackwell NVLink72、首个世界基础模型Cosmos等,并公布了在AI代理、物理AI等方面的布局和进展。新一代GeForce RTX 50系列芯...……更多
史无前例!Seq2Seq和GAN同获NeurIPS时间检验奖,Ilya连续2年获奖
...域受益于这项工作奠定的基础。这是建立编码器-解码器架构的基础工作,启发了后来基于注意力的改进,导致了今天的基础模型研究。 值得一提的是,三人的另一项工作——word2vec,也斩获了去年的NeurIPS时间检验奖。谷歌首席...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...能已推出预览版并支持Flan-T5、Llama和Mistral三种开放模型架构。模型推理方面,Bedrock Batch支持有效执行大量数据的模型推理任务,可在大规模推理任务中避免限流问题,无需编写代码即可处理故障并重启,适用于基础模型及用户...……更多
世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类
...度特征,导致样本质量不佳。为此,AI提出了一种新颖的架构,包含两个并行分支:一个处理原始输入的全局分支和一个处理放大版本的局部分支,并通过一个可学习的、时间步长条件的加权机制动态平衡它们的贡献。在四个不...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...资深的AI开发者,他独立开发的NonZero算子被合入异构计算架构CANN主线,参与开发的深度学习框架降低了大模型训练的门槛,目前正在做大模型分布式推理加速,希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在...……更多
探索AI落地路径,红帽胜算几何?
...化改造,消除现有系统和存储平台之间的障碍,提高基础架构的可持续性,并在云端、数据中心和边缘之间找到平衡点。 那么,如何以开源的方式将AI带入企业?在不久前举办的2024红帽全球峰会上,多年来在全球开源技术发展...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...过程的可扩展性。例如,选择标准的密集 Transformer 模型架构,只进行了少量调整,而不是采用专家混合模型,以最大限度地提高训练的稳定性。同样,采用相对简单的后训练程序,基于监督微调(SFT)、拒绝采样(RS)和直接偏...……更多
汽车新智能图谱里:理解腾讯的AI TO B路径
...,也是投入非常多的,包括跟客户一起去做一些从大模型架构的设计到场景的一些轻咨询,然后再到落地的一些培训、交付等等各个方面,我们都投入了大量人力去帮车企去一起去做。”姚振表示。而这种“躬身入局”的模式也...……更多
电力大模型:“聊、查、图、写”样样精通
...办法》正式施行已近两个月,“百模大战”不断升级。大模型具有海量的参数、复杂的算法和强大的训练能力,在电力、生物医药、网络安全等领域不断落地应用。为此,本版推出特别策划,展现大模型赋能千行百业的前景。◎...……更多
摩尔线程万卡GPU集群新进展!性能可提升20倍
...库FlagGems的适配工作。利用摩尔线程自研的统一系统计算架构MUSA,双方只用了短短一个多星期,就成功完成了近60个算子的功能验证,精度符合交付标准,并实现了对Bert-large模型的全面支持。摩尔线程研发团队经过充分调研论证...……更多
关于AI PC,联想和英特尔过于乐观了吗?
...求门槛是40TOPS,而英特尔即将发布的酷睿Ultra(Meteor Lake架构)可能达不到这个门槛,预计下一代的Lunar Lake才能。而Lunar Lake将于2024年采用18A制程制造,预计2025才会推出,或许会落后其它厂商的产品一年。 反观Arm架构阵营高通...……更多
联想发布DeepSeek一体机解决方案:支持千亿参数大模型训练
...“联想服务器/工作站+沐曦训推一体GPU+自主算法”为核心架构,配合联想AI force智能体开发平台,推出智能体一体机与训推一体服务器双产品形态,率先实现从千亿参数大模型训练到场景化推理落地的全链条覆盖。联想创新性推...……更多
国泰君安:维持腾讯控股“增持”评级 目标价459港元
...参数规模达万亿,预训练语料高达7万亿tokens,并采用MoE架构,文生图采用DIT架构。混元大模型具备256k超长上下文窗口,可处理超过38万字符的超长文本。在混元模型加持下,腾讯元宝支持图片/文件/语音等多种输入格式,可一次...……更多
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题,超连接可通过动态调整不同层之间的连接权重,解决梯度消失和表示崩溃(Representation Col...……更多
用“数”赋智,以“质”筑擎 | 联仁健康荣获宁波市产业数据价值化应用场景路演二等奖
...展的方式,将AI技术无缝嵌入到医院或影像科的基础设施架构和各类工作流程中,有效提升医生阅片效率及准确率。此外,随着平台的推广应用,可同步建设AI应用生态,实现产业上下游资源高效整合,推动健康产业数字化转型...……更多
类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
...的同时,业内质疑声纷至沓来,很多人并不认为基于 DiT 架构的视频生成模型能够真正理解物理规律。其中尤以 LeCun 为代表,一直以来,这位人工智能巨头一直坚称,基于概率的大语言模型无法理解常识,其中包括现实物理规律...……更多
infini-attention:谷歌大内存机制
...出的 Infini-attention机制(无限注意力)。它能让Transformer架构大模型在有限的计算资源里处理无限长的输入,在内存大小上实现 114倍压缩比。什么概念?就是在内存大小不变的情况下,放进去114倍多的信息。好比一个存放100本书...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...Llama 模型,因此 Meta 为其配备了支持图像推理的全新模型架构。具体来说,为了支持图像输入,Meta 训练了一组适应器权重(adapter weight),其可将预训练的图像编码器集成到预训练的语言模型中。该适应器由一系列交叉注意层...……更多
OPPO:用AndesGPT迎接下一个十年
...作为突破点,来作为AndesGPT的差异化特征,成为ColorOS底层架构的一部分。通过以上三点再结合AndesGPT所提供的能力,我们可以更好理解OPPO大模型的差异化打法:在AndesGPT的定义中,“对话”是GPT记忆能力、逻辑推理能力、模糊意...……更多
硬科技热潮来了,落地却为什么迟缓?
...车企和Tier 1公司内部的战略中都可以看到,整车电子电气架构的发展趋势,都是从分布式往中央式发展。其次,其实今年大家常提的就是降本,因为大家都要赚钱,降本也非常重要。基于这样大的背景下,如果要支撑跨域计算的...……更多
让AI无处不在 高通全面开启终端侧生成式AI大门
...就可以在终端侧通过Stable Diffusion生成图片。 全新异构架构的高通AI引擎是第三代骁龙8的AI性能卓越原因之一。Hexagon NPU升级了全新的微架构,性能提升了98%,能效提升了40%。Hexagon NPU集成了硬件加速单元、微型区块推理单...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...几个方面。”对此,腾讯面向汽车行业整合了完整的能力架构,从AI基座、AI平台再到业务场景应用全面助力汽车行业新智能发展,并和十多家车企探索大模型应用。以下是演讲全文:各位领导,各位行业同仁、媒体朋友们:大...……更多
李开复:已进入“AI教AI”时代,AI通过慢思考具备了反思能力,能自我迭代
...很大程度上已经不再单单依靠人来发明新算法、发明模型架构,而是AI借由慢思考具备了反思的能力,能够自我迭代、自我进步,AI进入了自我演进范式。”最后,李开复分享了自己对于DeepSeek的四个观察:通过破解并开源推理模...……更多
...为全省唯一通过中央网信办备案的基础大模型,采用自研架构,以“高效算力+低资源消耗”为核心优势,具备体积小、智慧程度高和使用成本低等特点,支持垂直大模型微调、衍生训练等业务,并具备单机离线部署、信创适配...……更多
所谓AI革命,到现在为止,是能源的一场“灾难”
...为主要有4点原因:目前主流的LLM模型采用了基于transformer架构的深度神经网络算法,这种架构的算法通过自注意力机制处理数据,并考虑序列的不同部分或句子的整个上下文,从而生成对模型结果的预测。市面上先进的LLM通常包...……更多
超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代
...部署到现有的边缘侧芯片上,主要原因包括:(1)传统架构矩阵算力缺口明显,大模型中50-80%算力需求在Attention层中的各类矩阵计算,并且KV矩阵有明显稀疏性,需要专项支持;(2)大模型的参数量和带宽需求巨大,单7B级别的...……更多
浪潮海岳大模型平台研发团队:记录一群浪潮青年人的梦想追寻之路
...索和不懈努力下,智能能力走向产品化。历经需求分析、架构设计、能力开发、技术验证等一系列过程后,团队发布浪潮海岳智能中台,以自定义训练平台,融合图像处理、知识图谱、AI能力纳管等技术,支撑企业应用实现智能...……更多
...一项复杂的系统工程,需要从多个方面进行系统化的设计架构。包括要解决如何实现算力的高效率、要解决算力系统如何保持线性可扩展以及算力系统长效稳定训练问题等。“因此,化解大模型‘建不了’难题,根源在于提升算...……更多
Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了
...速度快于封闭模型,他们希望在能够长期提供最大优势的架构上构建自己的系统。 开源 AI 之于 MetaMeta 的商业模式是为人们构建最佳体验和服务。为了实现这一目标,我们必须确保始终能够获取最佳技术,而不是被锁定在竞争...……更多
华为云昇腾AI云服务助力香港打造国际科创中心
...年 9 月投入运作,透过安全稳定的私有云和新的应用系统架构,让各部门可以更迅速、安全和具成本效益的方式开发电子政府服务,赋能智慧政府建设并推动智慧城市发展。发展人工智能产业生态圈对香港未来发展非常重要,华...……更多
更多关于科技的资讯:
中新经纬12月23日电 23日,据微信官方辟谣平台“谣言过滤器”发布消息称,12月22日晚某直播平台遭到黑灰产攻击,部分传言称“违规直播间中隐藏着病毒链接
2025-12-23 13:44:00
“我们每天吃的米面油,安全与品质究竟如何保障?”带着消费者的共同关切,主播以“质量观察员”的身份,走进益海嘉里金龙鱼,实地探访其覆盖全产业链的品控体系,寻找“全链条透明,高质量守
2025-12-23 11:28:00
邢台任泽区:电商直播培训助力农产品“出圈”
河北新闻网讯(苏行、孟学岗)为顺应数字经济发展新趋势,激发乡村产业新活力,12月17日至18日,邢台市任泽区举办电商直播带货现场培训观摩会
2025-12-23 10:44:00
家装测量难搞定?Fanttik激光测距仪帮你解决烦恼
在日常家装、看房验收或DIY创作中,精准与高效的测量至关重要。然而,传统工具常局限于单一功能,面对多种测量需求,用户不得不反复切换设备
2025-12-23 08:56:00
“前往杭州参加阿里巴巴的‘真牛奖’,全情投入,期待美好发生!”张英俊在朋友圈写道。工业化4.0时代,人要怎么跑赢机器?关于这个问题
2025-12-23 06:44:00
刘雨彤摘要:随着数字化进程的加速推进,大数据技术在风险管理中的作用愈发突显。传统风险管理依赖静态数据与人工判断,难以适应当前风险多变
2025-12-23 07:04:00
在日前举行的2025浙江省机器人行业发展大会上,由浙江大学机器人研究院(杭州市余杭区海创人形机器人产业创新中心)牵头,浙江省质量科学研究院
2025-12-23 07:14:00
12月17日至19日,惠购商盟“新零售数字化合规运营”高级人才研修班在国家市场监督管理总局行政学院(深圳南山)成功举办
2025-12-23 06:44:00
家委必藏!毕业照别乱找!忆学堂封神级拍摄,给娃留一辈子的青春纪念
在毕业季影像服务赛道,“专业”与“可靠”是始终不变的核心诉求。忆学堂从一间工作室成长为全国连锁品牌,凭借实打实的硬实力
2025-12-22 14:13:00
喜茶携手泡泡玛特星星人,首次全球同步联名活动正式上线
鲁网12月22日讯12月22日,喜茶与泡泡玛特(POP MART)旗下人气IP星星人的联名活动正式登陆喜茶全球门店,不少喜茶门店开业后就迅速进入制茶繁忙状态
2025-12-22 14:14:00
正雅于法国巴黎迪士尼成功举办早期矫治学术峰会
2025年12月13日,正雅齿科在法国巴黎迪士尼乐园酒店成功举办了"儿童早期矫治学术研讨会"。本次会议吸引了来自法国、瑞士
2025-12-22 14:20:00
2025游戏公益+研究报告在沪发布:公益是游戏体验的“加分项”
有多少游戏企业在游戏产品里做公益?他们做的公益活动被多少玩家接触过?在游戏里做公益是否会影响玩家游戏体验?在12月19日举办的2025中国游戏产业年会游戏公益+论坛上
2025-12-22 14:21:00
青岛城市传媒广场发布2026业态升级战略,携手多元品牌共筑“潮趣换新,自在未来”
12月20日,“潮趣换新,自在未来——青岛城市传媒广场新起点暨2026业态升级发布会”在青岛西海岸隆重举行。活动标志着这座扎根区域八年的文化商业地标正式开启全面焕新阶段
2025-12-22 14:49:00
年底前一项大利好政策来了!刚刚,央行发布《关于实施一次性信用修复政策有关安排的通知》,这意味着个人信用救济的重磅政策落地
2025-12-22 14:57:00
【宅男财经|专家面对面】据看看新闻报道,12月21日,俞敏洪在讲话中谈及董宇辉离职,仍亲切地喊他“孩子”,表示对目前结果感到满意
2025-12-22 15:00:00