• 我的订阅
  • 头条热搜
亚马逊云科技最强AI硬件猛兽背后,工程细节详细解读
...在评估性能时,亚马逊云科技会查看不同工作负载对CPU微架构的压力,比如工作负载是否对前端停摆敏感,前端停摆受分支数量、分支目标或指令等因素的影响,或者后端停顿受L1、L2和L3缓存中的数据以及指令窗口大小的影响。...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不同粗细和颜...……更多
...升级活动现场,图灵院技术研究部负责人王旭发布了全新架构的图灵易智产品体系。“我们通过整合算力、模型、工具、行业知识,打造了这个覆盖AI全链条的体系。”王旭说,产品将AI能力转化为可直接调用的“数字工具”,...……更多
始于安全,不止安全丨迪普科技AI基座解决方案发布
...成动态知识图谱实现上下文智能增强,并采用模块化插件架构支持外部工具的无缝接入,形成从业务逻辑抽象到系统落地的自动化闭环的智能体基座。同时创新性地采用“预训练+微调”双阶段驱动策略,通过知识蒸馏与迁移学...……更多
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?
...新智元导读】前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客,首篇博文的话题关于:基于encoder-only架构的BERT是如何被基于encoder-decoder架构的T5所取代的,分析了BERT灭绝的始末以及不同架构模型的优缺点,以史为鉴...……更多
阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
...型,但后来有朋友告知,这个大厂新模型完全就是LLaMA的架构,但为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。此外,海外也有工程师直接指出了这一点。“我们是小公司也不想得罪大佬...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...86B等。MoE(Mixture of Experts)是业界最前沿的混合专家模型架构 ,将多个细分领域的专家模型组合成一个超级模型,打破了传统扩展定律(Scaling Law)的局限,可在扩大模型规模时,不显著增加训练和推理的计算成本,保持模型性...……更多
腾讯云公布多项大模型产品进展
...模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视...……更多
阿里推出AI数据科学家,全流程自动化,科研小白也能用
...出,并反馈给用户。基于上述框架,咱们接着看整个系统架构,DS Assistant整套系统有4个主要模块。 先说右侧的DS Assistant,它作为整个系统的大脑,负责调度整个系统的运转。而Plan模块负责根据用户的需求生成一系列Task列表,...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...走完了整个多模态预训练流程。过程中他们从数据、模型架构与训练策略上协同推进,最终把相关发现形成科技报告并开放给所有人,也开源了最终的预训练模型与微调模型。值得一提的是,本次成果与苹果公司最近发布的多模...……更多
重庆特斯联冲刺AIoT第一股!3年29亿营收,六成来自AI产业数智化
...化和模块化部署,实现平台的规模化落地。TacOS整体技术架构分为五层:智算物联网、全域数字化、通用智能体、全场景应用及开发者平台。 简单来说,就是5个Any。智算物联网,AnyIOT,包括像传感器、控制器、云边端、机器人...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...来说,SOLAMI 从三个方面构建 3D 自主角色:(1)社交 VLA 架构:他们提出了一个统一的社交 VLA 框架,可根据用户的多模态输入生成多模态响应(语音和动作),从而驱动角色进行社交互动。(2)交互式多模态数据:他们推出了...……更多
玻色量子发布新一代550计算量子比特相干光量子计算机
...,源自于三大关键支柱:以GPU为代表的算力、以并行计算架构为代表的开发套件、以深度神经网络为代表的AI算法。而量子计算作为新质生产力中未来产业的核心,具有突破传统计算极限、引领未来科技发展的巨大潜力。进入量...……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...够像人类研究者一样进行整体性的思考和决策。 在技术架构层面, Deep Research由四个协同工作的核心模块构成,形成了一个完整的智能研究系统。第一,是信息发现模块,类似于系统的"探索者"。它能够敏锐地在学术数据库、科...……更多
rockaiyan架构大模型通过备案
...,上海岩芯数智人工智能科技有限公司(以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案,这是国内首个非Transformer架构大模型通过备案。Yan模型简介Yan架构大模型是国内首个非Transformer架构、非Atte...……更多
...牛旅游网研发中心总经理顾启宁介绍,在“端到端”设计架构下,途致大模型采取小参数“集群”模式,即将机票、酒店、景点等业务模块链接不同的应用接口,以更轻量化的参数运转应对用户碎片化出行需求,同时也能“合体...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...尔®至强®CPUMax系列处理器。这是英特尔唯一一款基于x86架构并采用高带宽内存(HBM)的CPU系列,采用了片上HBM设计,内存带宽高达4TB/s。和传统DDR5内存相比,HBM具有更多的访存通道和更长的读取位宽,理论带宽可达DDR5的4倍之多...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...务中保持模型整体性能。之前各种知识编辑的模型方法和架构包括类似于:修改模型内部参数、增加额外参数和基于检索方法都会有冗长的编辑前缀影响推理效率。对模型本身进行微调可能会导致过拟合,从而影响其原始性能。...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...,Semi 赛道侧重于考验核心主干技术,即更多地关注模型架构的选择以及特征提取泛化能力,对多模态大模型技术技术积累以及创新性要求比较高。 针对赛道少标签数据、高技术要求的特征,Soul 团队基于此前积累的自研大模型...……更多
摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化
...ong Cheng, Jianzhong Qi 等学者团队联合完成。该团队专注于大模型、知识图谱、推荐搜索、自然语言处理、大数据等方向的研究。知识图谱作为结构化知识的重要载体,广泛应用于信息检索、电商、决策推理等众多领域。然而,由于...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首...……更多
连发两款模型“补课”,百度AI成色如何?
...初步透露了多个层面的技术优化,包括注意力机制、模型架构、模型幻觉等方面。据介绍,文心4.5采用自研的FlashMask动态注意力掩码,降低了计算冗余和存储开销,可提升模型长序列建模能力和训练效率,优化了长文处理能力和...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...Pixtral都做了哪些工作。模型结构Pixtral 12B整体为Transformer架构,在大规模交错图像和文本文档上进行了预训练,具备多轮、多图像对话的能力。多模态解码器Pixtral的大语言模型主干选择了自家的Mistral Nemo 12B,decoder-only架构。内...……更多
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...务器搭载 NVIDIA H20 GPU,6U8卡 NVLink,是基于全新一代 AI超融合架构平台,面向超大规模数据中心的强劲性能,极致扩展的AI服务器,最强算力密度6U空间内搭载1块 NVIDIA Hopper架构 HGX-8GPU模组,系统支持4.0Tbps网络带宽,满足万亿级参数超大模.……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...于设计更高效的基于 Margin 的损失函数或者更复杂的网络架构,以此来帮助卷积神经网络更好地捕捉细腻度的人脸特征。近年来,无监督学习和图神经网络的成功已经表明了数据结构在提升模型泛化能力中的重要性。大规模人脸...……更多
蔚来智能驾驶研发部架构调整,探索端到端大模型?
...,据晚点LatePost报道,蔚来智能驾驶研发部于近日完成了架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚...……更多
美光、SK海力士公布SOCAMM内存模块:尺寸更小 功耗更低
...,SOCAMM的功耗仅为标准DDR5 RDIMM的三分之一,显著优化了AI架构的功耗性能曲线。SOCAMM通过使用4颗16-die堆叠的16Gb LPDDR5X颗粒,实现了128GB容量,结合128-bit位宽和8533 MT/s速率,为更快的AI模型训练和更高的推理并发用户量提供了关键...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...训练变得极为困难甚至无法实现。而大模型中 Transformer 架构的引入,则使模型具有高效的并行计算能力与灵活性,从而可以处理大规模数据集,并能通过微调预训练模型,快速适应不同任务场景。同时,其层次化结构能做到对...……更多
今日明星“端到端”,能否撑起智能驾驶的未来?|OpenTalk 回顾
...。直到2023年上海人工智能实验室发表的端到端自动驾驶架构UniAD获得CVPR 2023最佳论文、马斯克直播展示FSD,以及聚焦研发端到端自动驾驶系统的初创公司Wayve在2024年获10亿美元融资,各界才真的开始形成一个共识:端到端已经是...……更多
更多关于科技的资讯:
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00
2025教室节能照明标杆盘点 四大品牌绿色护眼解决方案解析
在“双碳”目标引领下,校园节能改造成为教育领域绿色发展的重要方向。据住建部统计,商业建筑能耗中照明系统占比高达35%,学校作为人员密集
2025-12-06 16:09:00
海尔智慧家电亮相迪拜
11月26日至28日,中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中,海尔智家针对当地高温、多尘等特点,集中展示了洗衣机
2025-12-06 16:10:00
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础,与手机厂商在操作系统层面合作开发的AI助手软件
2025-12-06 17:41:00
文化中国行|全场听觉无死角 吉林省音乐厅声学揭秘
历经修缮重生的丰乐剧场,以“吉林省音乐厅”之名即将绽放春城。这座历史建筑,从伪满时期影剧院到音乐剧场的跨越,背后藏着一套极致考究的声学设计方案
2025-12-06 18:41:00
伊贝格:让机床行业不再为“头”烦恼
“关键核心技术与高端装备对外依存度高”一直是制约制造业升级的瓶颈。五轴联动铣头作为五轴机床的核心功能部件,过去很长一段时间被欧洲部分知名厂商垄断
2025-12-06 22:07:00
山东重工潍柴集团2026年商务大会圆满召开
鲁网12月6日讯12月6日,以“乘势向上 聚力向新”为主题的山东重工潍柴集团2026年商务大会在潍坊举行。山东重工集团党委书记
2025-12-06 22:43:00
近日,兴业数金上线投产跨境人民币理财项目,建立基于手机银行APP的“跨境理财通”线上功能专区,助力本行成为第二家实现“跨境理财通”业务全线上办理的内地商业银行
2025-12-06 16:08:00
“我是一名肢残三级的残疾人,请问能享受哪些补贴?”输入文字,几秒钟过后,手机页面就出现了答案——杭州市各级政府的相关助残政策和补贴金额被清晰地列举出来
2025-12-06 10:21:00
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00