• 我的订阅
  • 头条热搜
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
...质。为此,北京大学李戈教授的团队提出了一种新型网络架构FAN(Fourier Analysis Networks)。通过引入傅里叶级数的思想,FAN能够将周期性信息直接嵌入网络的结构中,使模型更自然地捕捉和理解数据中的周期性模式。 实验表明,...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...提供了分成计划,推动了AI技术的广泛落地。6.首提时空架构,谷歌爆肝7个月祭出AI视频大模型Lumiere谷歌经过7个月的密集研发,推出了名为Lumiere的AI视频大模型,与传统的AI视频生成模型不同,Lumiere能够在一个连贯的过程中生成...……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
...了7个不同规模的Dense(稠密)模型,基于传统的Transformer架构,从规模最小的0.5B到最大的72B,不同大小的模型会有不同的能力和速度,以适配不同场景的需求。同时,在千问系列的迭代中,预训练数据的大小已经从Qwen1.5-72B时的3...……更多
联想提出混合智能,已开发“联想大脑”
...能化变革。六年前,联想围绕“端-边-云-网-智”新IT技术架构,开发了AI内嵌的智能终端、AI导向的基础设施和AI原生的方案服务,形成了全栈智能的产品及方案服务布局。此外,范建平博士还透露,联想已经开发了如“联想大脑...……更多
...量合成数据,全新的“日日新SenseNova 5.0”采用混合专家架构,推理时上下文窗口可以有效到200K左右。技术交流日上,商汤科技董事长兼CEO徐立表示,本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了非常强的适应性。混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用...……更多
华为云发布大模型混合云十大创新技术
...变强,模型参数不断增加,对端、边、云算力协同的整体架构设计提出了更高的要求。华为混合云CTO刘征辉在会上发表《打造最优混合云底座,使能大模型创新》主题演讲。 华为混合云CTO刘征辉刘征辉表示,依托全系列产品研...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...型权重、技术报告完全开源,免费商用,无需申请。模型架构本次开源的Skywork-MoE模型隶属于天工3.0的研发模型系列,是其中的中档大小模型(Skywork-MoE-Medium),模型的总参数量为146B,激活参数量22B,共有16个Expert,每个Expert大小...……更多
玄武科技引领革新 小A机器人大模型发布
...场产品发布会上展示了其最新研发成果——小A机器人大模型,标志着该公司在人工智能领域迈出了重要的一步。作为中国人工智能学会的理事单位,玄武科技再次证明了其在国内人工智能行业领先的创新能力。小A机器人大模型...……更多
...,包括资源调度策略、训推加速套件等并可支持多种硬件架构,屏蔽底层硬件差异,提升超大规模模型在训练、推理过程中稳定性、资源利用率和运行效率。到 2026年,研发一套支持万亿参数模型的超大规模训推一体化智算平台...……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
2024年1月10日,中国电信宣布,将自研星辰AI大型模型全面开源,以更好地助力客户业务的智能化升级。这一行动表明中国电信自研大型模型能力的成熟和完备,也展示了其在落地应用和拓展服务方面的强大实力。大模型开源,...……更多
斯坦福发布ai基础模型“透明度指标”
...要包含“模型训练上是否准确介绍了模型的模式、规模、架构”,平均透明度为63%。表现最差的则是影响(Impact),主要评估基础模型是否会“调取用户信息进行评估”,平均透明度只有11%。CRFM主任PercyLiang表示,商业基础模型...……更多
智慧芯同频共创,大模型智引未来,星宸科技开发者大会暨产品发布会圆满落幕
...、性价比最高的需求。 唐本冰同步分享了基于SAC8542的CMS架构、DMS/OMS+DVR架构,基于SAC8904的前视ADAS架构等创新方案,“我们的车载芯片出货量已超千万,未来将继续与产业链伙伴加大合作力度,加速实现汽车领域入门及腰部市...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...了全面的性能升级,其采用4000亿级参数MoE混合专家模型架构,是目前全球模型参数最大、性能最强的MoE模型之一。“天工3.0”的模型能力提升体现在以下四大方面:1、逻辑推理能力更强:更聪明逻辑推理能力的提升对于大模型...……更多
AI 面试:蓝海还是“难海”?
...的专业知识,以加强对上下文的理解。为此,以公司首席架构师 Dr. Laurence Lau 创造的 Talent-DNA 框架为基础,基于公司资深的 HR 行业专家知识,公司技术团队用结构化的形式总结人力资源知识,构建了自有知识图谱,通过带标签...……更多
...,引领了端到端自动驾驶研发的新趋势。但FSD V12的技术架构和复杂环境适应性需求对训练数据提出了更高的要求。数据的数量、质量和丰富度直接决定了算法的成熟度、安全性和商业化进程。“数据饥渴”正成为端到端自动驾...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...朝向之所以能够做到更自然的交互,和Gemini的原生多模态架构密不可分。Google解释了部分的训练细节。比如,Gemini的团队从一开始就针对不同的模态进行预训练,然后再使用额外的多模态数据对其进行微调,以进一步提升其能力...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
... AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型将于 Meta 公司 2024 年 7 月发布的 ……更多
西云算力举办AIGC沙龙,CTO梁峰分享“全系列全场景智算基础设施”
...OPS Utilization),即有效算力输出。梁峰指出,不同的模型架构、网络拓扑结构和优化策略都会影响这一指标,这考验着系统设计的功力,将会成为一个集群的核心竞争力之一。 白海科技联合创始人兼CEO卢亿雷从技术视角、落地...……更多
英特尔商用AI PC盛大起航 从芯出发向新而行
...杀手级应用,其不仅要求CPU和GPU更为强大,还要求计算机架构随之重构,引入高性能和低功耗的推理引擎。英特尔酷睿Ultra处理器,堪称是英特尔40年来最大的架构革新。英特尔酷睿Ultra处理器首次采用Intel4制程工艺结合先进的3DF...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...的任务执行,仍是当前尚未解决的问题。我们不仅需要使模型理解任务阶段本身,还需要从任务阶段的新角度重新审视多传感器融合。在一个复杂的操纵任务中完成将任务划分为不同阶段的一系列子目标的过程中,各个模态的数...……更多
国内首个热力行业多场景智慧客服系统发布
...、微信、数字人等场景的智慧客服系统(热力行业语言大模型)。该系统全面展示了人工智能与Deep Seek技术在智慧供热客服系统中的创新应用与实践,也是济南能源集团自主研发的国内首个ERP超融合管理平台供热板块的重要创新...……更多
...型厂商如OpenAI、谷歌、Mistral AI、浪潮信息等陆续基于MoE架构升级自家大模型产品的原因。从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。MM1.5提...……更多
加州大学团队开发异构编程新模型,开辟提升处理器性能新路径
...些困难,研究人员开发了一个由三个主要部分组成的系统架构:首先,SHMT 引入了一种虚拟硬件的概念,允许开发者将计算任务借助一系列虚拟操作(Virtual Operations,VOPs)的形式从 CPU“卸载”。VOPs 定义了 SHMT 底层硬件可支持的...……更多
AI大模型赋能交通:化身“数字运维专家”,融入车管电子书
...大型研究,协同探索人工智能发展创新。本次推出“有AI模型”系列报道,南都研究员与南方都市报“AI治理与创新智联体”专家一同走访广东人工智能大模型研发企业,看AI大模型如何赋能千行百业。第一期,走进广东省首批战...……更多
微软谷歌季绩揭示了什么?
...支为140亿美元,主要用于支持其云需求,包括扩展AI基础架构。用于设备、厂房和物业的现金支出为110亿美元。期内,来自经营活动的净现金流入为319亿美元,增长31%,主要受到强劲的云计算业务回款带动。自由现金流为210亿美...……更多
...高频服务事项,搭建了数千条公共资源交易领域问答知识架构。通过大模型持续标注和训练,支持“输入关键词即得全流程指引”一键触达,构建起覆盖交易全链条的标准化知识库。二是智能交互重构服务体验。“咨询小易”突...……更多
商汤大装置发布基于DeepLink的异构混合调度方案,加速国产算力从“可用”迈向“好用”
...过训练加速、异构通信、并行策略等核心技术,打破芯片架构差异带来的协同壁垒,重构计算资源调度体系。今年2月,上海AI实验室联合包括商汤在内的十余家合作伙伴,于上海建成了超大规模跨域混训集群原型,并已在千亿量级参数...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...功之处在于为图像视频等多模态数据找到了适合Transformer架构的表征方式,从而将ScalingLaw从语言模型复制到了图像视频模型。此外,Sora在训练时还借助了DALL·E3生成的高质量文本描述,在推理时借助了GPT对用户输入进行扩展,可...……更多
更多关于科技的资讯:
中新经纬12月23日电 23日,据微信官方辟谣平台“谣言过滤器”发布消息称,12月22日晚某直播平台遭到黑灰产攻击,部分传言称“违规直播间中隐藏着病毒链接
2025-12-23 13:44:00
“我们每天吃的米面油,安全与品质究竟如何保障?”带着消费者的共同关切,主播以“质量观察员”的身份,走进益海嘉里金龙鱼,实地探访其覆盖全产业链的品控体系,寻找“全链条透明,高质量守
2025-12-23 11:28:00
邢台任泽区:电商直播培训助力农产品“出圈”
河北新闻网讯(苏行、孟学岗)为顺应数字经济发展新趋势,激发乡村产业新活力,12月17日至18日,邢台市任泽区举办电商直播带货现场培训观摩会
2025-12-23 10:44:00
家装测量难搞定?Fanttik激光测距仪帮你解决烦恼
在日常家装、看房验收或DIY创作中,精准与高效的测量至关重要。然而,传统工具常局限于单一功能,面对多种测量需求,用户不得不反复切换设备
2025-12-23 08:56:00
“前往杭州参加阿里巴巴的‘真牛奖’,全情投入,期待美好发生!”张英俊在朋友圈写道。工业化4.0时代,人要怎么跑赢机器?关于这个问题
2025-12-23 06:44:00
刘雨彤摘要:随着数字化进程的加速推进,大数据技术在风险管理中的作用愈发突显。传统风险管理依赖静态数据与人工判断,难以适应当前风险多变
2025-12-23 07:04:00
在日前举行的2025浙江省机器人行业发展大会上,由浙江大学机器人研究院(杭州市余杭区海创人形机器人产业创新中心)牵头,浙江省质量科学研究院
2025-12-23 07:14:00
12月17日至19日,惠购商盟“新零售数字化合规运营”高级人才研修班在国家市场监督管理总局行政学院(深圳南山)成功举办
2025-12-23 06:44:00
家委必藏!毕业照别乱找!忆学堂封神级拍摄,给娃留一辈子的青春纪念
在毕业季影像服务赛道,“专业”与“可靠”是始终不变的核心诉求。忆学堂从一间工作室成长为全国连锁品牌,凭借实打实的硬实力
2025-12-22 14:13:00
喜茶携手泡泡玛特星星人,首次全球同步联名活动正式上线
鲁网12月22日讯12月22日,喜茶与泡泡玛特(POP MART)旗下人气IP星星人的联名活动正式登陆喜茶全球门店,不少喜茶门店开业后就迅速进入制茶繁忙状态
2025-12-22 14:14:00
正雅于法国巴黎迪士尼成功举办早期矫治学术峰会
2025年12月13日,正雅齿科在法国巴黎迪士尼乐园酒店成功举办了"儿童早期矫治学术研讨会"。本次会议吸引了来自法国、瑞士
2025-12-22 14:20:00
2025游戏公益+研究报告在沪发布:公益是游戏体验的“加分项”
有多少游戏企业在游戏产品里做公益?他们做的公益活动被多少玩家接触过?在游戏里做公益是否会影响玩家游戏体验?在12月19日举办的2025中国游戏产业年会游戏公益+论坛上
2025-12-22 14:21:00
青岛城市传媒广场发布2026业态升级战略,携手多元品牌共筑“潮趣换新,自在未来”
12月20日,“潮趣换新,自在未来——青岛城市传媒广场新起点暨2026业态升级发布会”在青岛西海岸隆重举行。活动标志着这座扎根区域八年的文化商业地标正式开启全面焕新阶段
2025-12-22 14:49:00
年底前一项大利好政策来了!刚刚,央行发布《关于实施一次性信用修复政策有关安排的通知》,这意味着个人信用救济的重磅政策落地
2025-12-22 14:57:00
【宅男财经|专家面对面】据看看新闻报道,12月21日,俞敏洪在讲话中谈及董宇辉离职,仍亲切地喊他“孩子”,表示对目前结果感到满意
2025-12-22 15:00:00