• 我的订阅
  • 头条热搜
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
...质。为此,北京大学李戈教授的团队提出了一种新型网络架构FAN(Fourier Analysis Networks)。通过引入傅里叶级数的思想,FAN能够将周期性信息直接嵌入网络的结构中,使模型更自然地捕捉和理解数据中的周期性模式。 实验表明,...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...提供了分成计划,推动了AI技术的广泛落地。6.首提时空架构,谷歌爆肝7个月祭出AI视频大模型Lumiere谷歌经过7个月的密集研发,推出了名为Lumiere的AI视频大模型,与传统的AI视频生成模型不同,Lumiere能够在一个连贯的过程中生成...……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
...了7个不同规模的Dense(稠密)模型,基于传统的Transformer架构,从规模最小的0.5B到最大的72B,不同大小的模型会有不同的能力和速度,以适配不同场景的需求。同时,在千问系列的迭代中,预训练数据的大小已经从Qwen1.5-72B时的3...……更多
联想提出混合智能,已开发“联想大脑”
...能化变革。六年前,联想围绕“端-边-云-网-智”新IT技术架构,开发了AI内嵌的智能终端、AI导向的基础设施和AI原生的方案服务,形成了全栈智能的产品及方案服务布局。此外,范建平博士还透露,联想已经开发了如“联想大脑...……更多
...量合成数据,全新的“日日新SenseNova 5.0”采用混合专家架构,推理时上下文窗口可以有效到200K左右。技术交流日上,商汤科技董事长兼CEO徐立表示,本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了非常强的适应性。混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用...……更多
华为云发布大模型混合云十大创新技术
...变强,模型参数不断增加,对端、边、云算力协同的整体架构设计提出了更高的要求。华为混合云CTO刘征辉在会上发表《打造最优混合云底座,使能大模型创新》主题演讲。 华为混合云CTO刘征辉刘征辉表示,依托全系列产品研...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...型权重、技术报告完全开源,免费商用,无需申请。模型架构本次开源的Skywork-MoE模型隶属于天工3.0的研发模型系列,是其中的中档大小模型(Skywork-MoE-Medium),模型的总参数量为146B,激活参数量22B,共有16个Expert,每个Expert大小...……更多
玄武科技引领革新 小A机器人大模型发布
...场产品发布会上展示了其最新研发成果——小A机器人大模型,标志着该公司在人工智能领域迈出了重要的一步。作为中国人工智能学会的理事单位,玄武科技再次证明了其在国内人工智能行业领先的创新能力。小A机器人大模型...……更多
...,包括资源调度策略、训推加速套件等并可支持多种硬件架构,屏蔽底层硬件差异,提升超大规模模型在训练、推理过程中稳定性、资源利用率和运行效率。到 2026年,研发一套支持万亿参数模型的超大规模训推一体化智算平台...……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
2024年1月10日,中国电信宣布,将自研星辰AI大型模型全面开源,以更好地助力客户业务的智能化升级。这一行动表明中国电信自研大型模型能力的成熟和完备,也展示了其在落地应用和拓展服务方面的强大实力。大模型开源,...……更多
斯坦福发布ai基础模型“透明度指标”
...要包含“模型训练上是否准确介绍了模型的模式、规模、架构”,平均透明度为63%。表现最差的则是影响(Impact),主要评估基础模型是否会“调取用户信息进行评估”,平均透明度只有11%。CRFM主任PercyLiang表示,商业基础模型...……更多
智慧芯同频共创,大模型智引未来,星宸科技开发者大会暨产品发布会圆满落幕
...、性价比最高的需求。 唐本冰同步分享了基于SAC8542的CMS架构、DMS/OMS+DVR架构,基于SAC8904的前视ADAS架构等创新方案,“我们的车载芯片出货量已超千万,未来将继续与产业链伙伴加大合作力度,加速实现汽车领域入门及腰部市...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...了全面的性能升级,其采用4000亿级参数MoE混合专家模型架构,是目前全球模型参数最大、性能最强的MoE模型之一。“天工3.0”的模型能力提升体现在以下四大方面:1、逻辑推理能力更强:更聪明逻辑推理能力的提升对于大模型...……更多
AI 面试:蓝海还是“难海”?
...的专业知识,以加强对上下文的理解。为此,以公司首席架构师 Dr. Laurence Lau 创造的 Talent-DNA 框架为基础,基于公司资深的 HR 行业专家知识,公司技术团队用结构化的形式总结人力资源知识,构建了自有知识图谱,通过带标签...……更多
...,引领了端到端自动驾驶研发的新趋势。但FSD V12的技术架构和复杂环境适应性需求对训练数据提出了更高的要求。数据的数量、质量和丰富度直接决定了算法的成熟度、安全性和商业化进程。“数据饥渴”正成为端到端自动驾...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...朝向之所以能够做到更自然的交互,和Gemini的原生多模态架构密不可分。Google解释了部分的训练细节。比如,Gemini的团队从一开始就针对不同的模态进行预训练,然后再使用额外的多模态数据对其进行微调,以进一步提升其能力...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
... AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型将于 Meta 公司 2024 年 7 月发布的 ……更多
英特尔商用AI PC盛大起航 从芯出发向新而行
...杀手级应用,其不仅要求CPU和GPU更为强大,还要求计算机架构随之重构,引入高性能和低功耗的推理引擎。英特尔酷睿Ultra处理器,堪称是英特尔40年来最大的架构革新。英特尔酷睿Ultra处理器首次采用Intel4制程工艺结合先进的3DF...……更多
西云算力举办AIGC沙龙,CTO梁峰分享“全系列全场景智算基础设施”
...OPS Utilization),即有效算力输出。梁峰指出,不同的模型架构、网络拓扑结构和优化策略都会影响这一指标,这考验着系统设计的功力,将会成为一个集群的核心竞争力之一。 白海科技联合创始人兼CEO卢亿雷从技术视角、落地...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...的任务执行,仍是当前尚未解决的问题。我们不仅需要使模型理解任务阶段本身,还需要从任务阶段的新角度重新审视多传感器融合。在一个复杂的操纵任务中完成将任务划分为不同阶段的一系列子目标的过程中,各个模态的数...……更多
国内首个热力行业多场景智慧客服系统发布
...、微信、数字人等场景的智慧客服系统(热力行业语言大模型)。该系统全面展示了人工智能与Deep Seek技术在智慧供热客服系统中的创新应用与实践,也是济南能源集团自主研发的国内首个ERP超融合管理平台供热板块的重要创新...……更多
...型厂商如OpenAI、谷歌、Mistral AI、浪潮信息等陆续基于MoE架构升级自家大模型产品的原因。从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网...……更多
加州大学团队开发异构编程新模型,开辟提升处理器性能新路径
...些困难,研究人员开发了一个由三个主要部分组成的系统架构:首先,SHMT 引入了一种虚拟硬件的概念,允许开发者将计算任务借助一系列虚拟操作(Virtual Operations,VOPs)的形式从 CPU“卸载”。VOPs 定义了 SHMT 底层硬件可支持的...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。MM1.5提...……更多
AI大模型赋能交通:化身“数字运维专家”,融入车管电子书
...大型研究,协同探索人工智能发展创新。本次推出“有AI模型”系列报道,南都研究员与南方都市报“AI治理与创新智联体”专家一同走访广东人工智能大模型研发企业,看AI大模型如何赋能千行百业。第一期,走进广东省首批战...……更多
微软谷歌季绩揭示了什么?
...支为140亿美元,主要用于支持其云需求,包括扩展AI基础架构。用于设备、厂房和物业的现金支出为110亿美元。期内,来自经营活动的净现金流入为319亿美元,增长31%,主要受到强劲的云计算业务回款带动。自由现金流为210亿美...……更多
...高频服务事项,搭建了数千条公共资源交易领域问答知识架构。通过大模型持续标注和训练,支持“输入关键词即得全流程指引”一键触达,构建起覆盖交易全链条的标准化知识库。二是智能交互重构服务体验。“咨询小易”突...……更多
商汤大装置发布基于DeepLink的异构混合调度方案,加速国产算力从“可用”迈向“好用”
...过训练加速、异构通信、并行策略等核心技术,打破芯片架构差异带来的协同壁垒,重构计算资源调度体系。今年2月,上海AI实验室联合包括商汤在内的十余家合作伙伴,于上海建成了超大规模跨域混训集群原型,并已在千亿量级参数...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...功之处在于为图像视频等多模态数据找到了适合Transformer架构的表征方式,从而将ScalingLaw从语言模型复制到了图像视频模型。此外,Sora在训练时还借助了DALL·E3生成的高质量文本描述,在推理时借助了GPT对用户输入进行扩展,可...……更多
更多关于科技的资讯:
近日,上城区发布第四批“人工智能+”机会场景清单,25个场景聚焦产业升级、金融服务、智慧教育、智能医疗等重点领域。据悉
2025-12-13 08:06:00
“甩一甩”就能测温的水银体温计,即将在2026年1月1日全面禁产的政策下退出历史舞台。这则消息引发的全网热议,恰是怀旧情感与环保理性
2025-12-13 08:16:00
厦门网讯(厦门日报记者 应洁)昨日,“新质设计——红点产品设计大奖·中国获奖作品精选展”在红点厦门设计博物馆开展,来自70多家中国企业的百余件“红点奖”获奖作品呈现出国际一流设计的“中国力量”
2025-12-13 08:39:00
第六届中国人工智能大赛配套论坛在厦成功举办
厦门网讯(厦门日报记者 翁华鸿 通讯员 张晶晶 王艳红)12日,第六届中国人工智能大赛配套论坛在厦门成功举办。论坛以“融新汇智
2025-12-13 08:39:00
中新经纬12月13日电 据“网信中国”微信号13日消息,2025年12月2日,中央网信办提出并归口的《数据安全技术 电子产品信息清除技术要求》强制性国家标准由国家市场监督管理总局
2025-12-13 10:42:00
中国科大利用磁力系统实现宽带磁声混合频率梳
大皖新闻讯 12月13日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在磁力系统研究中取得新进展。该团队董春华教授研究组通过磁振子与高频声子相互作用
2025-12-13 14:35:00
京东宠物百千万爆品计划启动:联合pidan打造确定性产品 单款猫砂月销1500万
猫砂是猫用品购买频率最高的产品,其潜力被外界看好。不过,因行业门槛低,这两年入局者多、竞争加剧,猫砂利润像纸一样薄,最低仅1%
2025-12-13 14:56:00
2025年“福满榕城 奋勇争先”短视频征集展播——《项目审批专班:“五项机制”激活发展新效能》。
2025-12-13 15:03:00
沁珠宝的2025年:文化赋能,匠心质造,新中式珠宝坚定前行
2025年,是新中式珠宝赛道蓬勃发展的一年,也是沁珠宝以文化为帆、品质为桨,实现跨越式发展的关键之年。在刚刚过去的2025年11月
2025-12-13 16:41:00
鲸鸿动能系列营销案例正式入库复旦管院案例中心,开启产学融合新路径
2025年12月10日,由复旦大学管理学院与鲸鸿动能联合举办的“技术驱动的商业创新:从生态支撑到全球竞逐”主题的案例课堂暨鲸鸿动能案例入库仪式
2025-12-13 16:42:00
硬核突破!全球领先脑肿瘤放疗设备将在廊坊临空实现“中国制造、全球交付”
河北新闻网讯(刘英、刘岩)12月6日,百洋医药高端制造产业化基地在临空经济区(廊坊)高端智能制造港正式启用投产,将承担全球领先脑肿瘤精准放疗设备ZAP-X火星舟放射外科机器人的生产供应任务
2025-12-13 17:52:00
开栏语 深圳,一座将创新刻入基因的城市。无数海归人才,正是这基因中最活跃的段落。作为改革开放的窗口与先锋,她以澎湃的活力与无限的机遇
2025-12-14 11:22:00
日前,第七届浙江国际智慧交通产业博览会在杭州盛大开幕。开幕式上,多项重磅政策与创新成果集中亮相,省交通运输厅、省科技厅共同发布《交通科技创新合作协议》
2025-12-14 11:39:00
海辰储能第三届生态日 发布长时储能与AIDC最新成果
当前,长时储能技术已成为破解新能源波动性难题、打造全天候绿电系统的核心支撑,而AIDC等高能耗行业也亟需依托长时储能的优势破解能源困局
2025-12-14 12:45:00