• 我的订阅
  • 头条热搜
亚马逊云科技最强AI硬件猛兽背后,工程细节详细解读
...在评估性能时,亚马逊云科技会查看不同工作负载对CPU微架构的压力,比如工作负载是否对前端停摆敏感,前端停摆受分支数量、分支目标或指令等因素的影响,或者后端停顿受L1、L2和L3缓存中的数据以及指令窗口大小的影响。...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不同粗细和颜...……更多
...升级活动现场,图灵院技术研究部负责人王旭发布了全新架构的图灵易智产品体系。“我们通过整合算力、模型、工具、行业知识,打造了这个覆盖AI全链条的体系。”王旭说,产品将AI能力转化为可直接调用的“数字工具”,...……更多
始于安全,不止安全丨迪普科技AI基座解决方案发布
...成动态知识图谱实现上下文智能增强,并采用模块化插件架构支持外部工具的无缝接入,形成从业务逻辑抽象到系统落地的自动化闭环的智能体基座。同时创新性地采用“预训练+微调”双阶段驱动策略,通过知识蒸馏与迁移学...……更多
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?
...新智元导读】前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客,首篇博文的话题关于:基于encoder-only架构的BERT是如何被基于encoder-decoder架构的T5所取代的,分析了BERT灭绝的始末以及不同架构模型的优缺点,以史为鉴...……更多
阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
...型,但后来有朋友告知,这个大厂新模型完全就是LLaMA的架构,但为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。此外,海外也有工程师直接指出了这一点。“我们是小公司也不想得罪大佬...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...86B等。MoE(Mixture of Experts)是业界最前沿的混合专家模型架构 ,将多个细分领域的专家模型组合成一个超级模型,打破了传统扩展定律(Scaling Law)的局限,可在扩大模型规模时,不显著增加训练和推理的计算成本,保持模型性...……更多
腾讯云公布多项大模型产品进展
...模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视...……更多
阿里推出AI数据科学家,全流程自动化,科研小白也能用
...出,并反馈给用户。基于上述框架,咱们接着看整个系统架构,DS Assistant整套系统有4个主要模块。 先说右侧的DS Assistant,它作为整个系统的大脑,负责调度整个系统的运转。而Plan模块负责根据用户的需求生成一系列Task列表,...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...走完了整个多模态预训练流程。过程中他们从数据、模型架构与训练策略上协同推进,最终把相关发现形成科技报告并开放给所有人,也开源了最终的预训练模型与微调模型。值得一提的是,本次成果与苹果公司最近发布的多模...……更多
重庆特斯联冲刺AIoT第一股!3年29亿营收,六成来自AI产业数智化
...化和模块化部署,实现平台的规模化落地。TacOS整体技术架构分为五层:智算物联网、全域数字化、通用智能体、全场景应用及开发者平台。 简单来说,就是5个Any。智算物联网,AnyIOT,包括像传感器、控制器、云边端、机器人...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...来说,SOLAMI 从三个方面构建 3D 自主角色:(1)社交 VLA 架构:他们提出了一个统一的社交 VLA 框架,可根据用户的多模态输入生成多模态响应(语音和动作),从而驱动角色进行社交互动。(2)交互式多模态数据:他们推出了...……更多
玻色量子发布新一代550计算量子比特相干光量子计算机
...,源自于三大关键支柱:以GPU为代表的算力、以并行计算架构为代表的开发套件、以深度神经网络为代表的AI算法。而量子计算作为新质生产力中未来产业的核心,具有突破传统计算极限、引领未来科技发展的巨大潜力。进入量...……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...够像人类研究者一样进行整体性的思考和决策。 在技术架构层面, Deep Research由四个协同工作的核心模块构成,形成了一个完整的智能研究系统。第一,是信息发现模块,类似于系统的"探索者"。它能够敏锐地在学术数据库、科...……更多
rockaiyan架构大模型通过备案
...,上海岩芯数智人工智能科技有限公司(以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案,这是国内首个非Transformer架构大模型通过备案。Yan模型简介Yan架构大模型是国内首个非Transformer架构、非Atte...……更多
...牛旅游网研发中心总经理顾启宁介绍,在“端到端”设计架构下,途致大模型采取小参数“集群”模式,即将机票、酒店、景点等业务模块链接不同的应用接口,以更轻量化的参数运转应对用户碎片化出行需求,同时也能“合体...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...尔®至强®CPUMax系列处理器。这是英特尔唯一一款基于x86架构并采用高带宽内存(HBM)的CPU系列,采用了片上HBM设计,内存带宽高达4TB/s。和传统DDR5内存相比,HBM具有更多的访存通道和更长的读取位宽,理论带宽可达DDR5的4倍之多...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...务中保持模型整体性能。之前各种知识编辑的模型方法和架构包括类似于:修改模型内部参数、增加额外参数和基于检索方法都会有冗长的编辑前缀影响推理效率。对模型本身进行微调可能会导致过拟合,从而影响其原始性能。...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...,Semi 赛道侧重于考验核心主干技术,即更多地关注模型架构的选择以及特征提取泛化能力,对多模态大模型技术技术积累以及创新性要求比较高。 针对赛道少标签数据、高技术要求的特征,Soul 团队基于此前积累的自研大模型...……更多
摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化
...ong Cheng, Jianzhong Qi 等学者团队联合完成。该团队专注于大模型、知识图谱、推荐搜索、自然语言处理、大数据等方向的研究。知识图谱作为结构化知识的重要载体,广泛应用于信息检索、电商、决策推理等众多领域。然而,由于...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首...……更多
连发两款模型“补课”,百度AI成色如何?
...初步透露了多个层面的技术优化,包括注意力机制、模型架构、模型幻觉等方面。据介绍,文心4.5采用自研的FlashMask动态注意力掩码,降低了计算冗余和存储开销,可提升模型长序列建模能力和训练效率,优化了长文处理能力和...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...Pixtral都做了哪些工作。模型结构Pixtral 12B整体为Transformer架构,在大规模交错图像和文本文档上进行了预训练,具备多轮、多图像对话的能力。多模态解码器Pixtral的大语言模型主干选择了自家的Mistral Nemo 12B,decoder-only架构。内...……更多
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...务器搭载 NVIDIA H20 GPU,6U8卡 NVLink,是基于全新一代 AI超融合架构平台,面向超大规模数据中心的强劲性能,极致扩展的AI服务器,最强算力密度6U空间内搭载1块 NVIDIA Hopper架构 HGX-8GPU模组,系统支持4.0Tbps网络带宽,满足万亿级参数超大模.……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...于设计更高效的基于 Margin 的损失函数或者更复杂的网络架构,以此来帮助卷积神经网络更好地捕捉细腻度的人脸特征。近年来,无监督学习和图神经网络的成功已经表明了数据结构在提升模型泛化能力中的重要性。大规模人脸...……更多
蔚来智能驾驶研发部架构调整,探索端到端大模型?
...,据晚点LatePost报道,蔚来智能驾驶研发部于近日完成了架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚...……更多
美光、SK海力士公布SOCAMM内存模块:尺寸更小 功耗更低
...,SOCAMM的功耗仅为标准DDR5 RDIMM的三分之一,显著优化了AI架构的功耗性能曲线。SOCAMM通过使用4颗16-die堆叠的16Gb LPDDR5X颗粒,实现了128GB容量,结合128-bit位宽和8533 MT/s速率,为更快的AI模型训练和更高的推理并发用户量提供了关键...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...训练变得极为困难甚至无法实现。而大模型中 Transformer 架构的引入,则使模型具有高效的并行计算能力与灵活性,从而可以处理大规模数据集,并能通过微调预训练模型,快速适应不同任务场景。同时,其层次化结构能做到对...……更多
今日明星“端到端”,能否撑起智能驾驶的未来?|OpenTalk 回顾
...。直到2023年上海人工智能实验室发表的端到端自动驾驶架构UniAD获得CVPR 2023最佳论文、马斯克直播展示FSD,以及聚焦研发端到端自动驾驶系统的初创公司Wayve在2024年获10亿美元融资,各界才真的开始形成一个共识:端到端已经是...……更多
更多关于科技的资讯:
近日,兴业数金上线投产跨境人民币理财项目,建立基于手机银行APP的“跨境理财通”线上功能专区,助力本行成为第二家实现“跨境理财通”业务全线上办理的内地商业银行
2025-12-06 16:08:00
“我是一名肢残三级的残疾人,请问能享受哪些补贴?”输入文字,几秒钟过后,手机页面就出现了答案——杭州市各级政府的相关助残政策和补贴金额被清晰地列举出来
2025-12-06 10:21:00
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00
烟台南山学院斩获省部级科技奖荣誉
近日,2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”
2025-12-05 15:00:00
盐城盐都:“芯”智散热赋能 科创驱动前行
江南时报讯 以科创破局散热赛道,以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮,盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势
2025-12-05 15:07:00
中新建电力集团发电产业:智慧电厂新蓝图
近日,中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级,上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划
2025-12-05 15:09:00
日前,建行河北省分行2025年“人工智能+”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛,经过严格的初审选拔
2025-12-05 15:09:00
全国首台套!助力煤矸石全量高值转化
12月1日,由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运
2025-12-05 15:10:00
如何“反内卷”?54.5%职场人将“优化薪酬激励机制”列为首选
什么是“好工作”?工作有哪些特质会让员工有“好”感受?日前,智联招聘通过问卷调研的方式,对平台用户展开调研,回收3525份有效样本
2025-12-05 15:26:00
国航举办“国航+”生态主题发布会
海外网北京12月5日电(记者严冰)12月5日,中国国际航空股份有限公司(以下简称“国航”)在北京举办“云端无界 凤启耀星河——‘国航+’生态主题发布会”
2025-12-05 15:33:00
乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业!
12月5日,国内仓储式品牌特卖开创者荟品仓,在房山区瑞来广场盛大开业,带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣
2025-12-05 15:55:00
易生支付“智慧分账”赋能安心鲜生 驱动社区零售全国布局
在社区零售数字化转型加速深化的背景下,易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力
2025-12-05 16:09:00
ED用药怎么选?金钢鸟领衔西地那非口崩片品牌阵营,购买渠道全解析
第91届全国药交会上,金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相,让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点
2025-12-05 16:09:00
苏州黄埭镇推动“产学研”深度融合
江南时报讯 日前,苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作,联合启动轮式双臂机器人研发项目,致力于推动创新成果向现实生产力加速转化
2025-12-05 16:13:00
近邻碰碰:以 “邻里经济”打造智慧社区消费新生态 —— 专访小门神传媒科技集团董事长付信中
鲁网12月4日讯“远亲不如近邻”,这句家喻户晓的俗语,如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备
2025-12-05 16:47:00