• 我的订阅
  • 头条热搜
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
...质。为此,北京大学李戈教授的团队提出了一种新型网络架构FAN(Fourier Analysis Networks)。通过引入傅里叶级数的思想,FAN能够将周期性信息直接嵌入网络的结构中,使模型更自然地捕捉和理解数据中的周期性模式。 实验表明,...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...提供了分成计划,推动了AI技术的广泛落地。6.首提时空架构,谷歌爆肝7个月祭出AI视频大模型Lumiere谷歌经过7个月的密集研发,推出了名为Lumiere的AI视频大模型,与传统的AI视频生成模型不同,Lumiere能够在一个连贯的过程中生成...……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
...了7个不同规模的Dense(稠密)模型,基于传统的Transformer架构,从规模最小的0.5B到最大的72B,不同大小的模型会有不同的能力和速度,以适配不同场景的需求。同时,在千问系列的迭代中,预训练数据的大小已经从Qwen1.5-72B时的3...……更多
联想提出混合智能,已开发“联想大脑”
...能化变革。六年前,联想围绕“端-边-云-网-智”新IT技术架构,开发了AI内嵌的智能终端、AI导向的基础设施和AI原生的方案服务,形成了全栈智能的产品及方案服务布局。此外,范建平博士还透露,联想已经开发了如“联想大脑...……更多
...量合成数据,全新的“日日新SenseNova 5.0”采用混合专家架构,推理时上下文窗口可以有效到200K左右。技术交流日上,商汤科技董事长兼CEO徐立表示,本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了非常强的适应性。混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用...……更多
华为云发布大模型混合云十大创新技术
...变强,模型参数不断增加,对端、边、云算力协同的整体架构设计提出了更高的要求。华为混合云CTO刘征辉在会上发表《打造最优混合云底座,使能大模型创新》主题演讲。 华为混合云CTO刘征辉刘征辉表示,依托全系列产品研...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...型权重、技术报告完全开源,免费商用,无需申请。模型架构本次开源的Skywork-MoE模型隶属于天工3.0的研发模型系列,是其中的中档大小模型(Skywork-MoE-Medium),模型的总参数量为146B,激活参数量22B,共有16个Expert,每个Expert大小...……更多
玄武科技引领革新 小A机器人大模型发布
...场产品发布会上展示了其最新研发成果——小A机器人大模型,标志着该公司在人工智能领域迈出了重要的一步。作为中国人工智能学会的理事单位,玄武科技再次证明了其在国内人工智能行业领先的创新能力。小A机器人大模型...……更多
...,包括资源调度策略、训推加速套件等并可支持多种硬件架构,屏蔽底层硬件差异,提升超大规模模型在训练、推理过程中稳定性、资源利用率和运行效率。到 2026年,研发一套支持万亿参数模型的超大规模训推一体化智算平台...……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
2024年1月10日,中国电信宣布,将自研星辰AI大型模型全面开源,以更好地助力客户业务的智能化升级。这一行动表明中国电信自研大型模型能力的成熟和完备,也展示了其在落地应用和拓展服务方面的强大实力。大模型开源,...……更多
斯坦福发布ai基础模型“透明度指标”
...要包含“模型训练上是否准确介绍了模型的模式、规模、架构”,平均透明度为63%。表现最差的则是影响(Impact),主要评估基础模型是否会“调取用户信息进行评估”,平均透明度只有11%。CRFM主任PercyLiang表示,商业基础模型...……更多
智慧芯同频共创,大模型智引未来,星宸科技开发者大会暨产品发布会圆满落幕
...、性价比最高的需求。 唐本冰同步分享了基于SAC8542的CMS架构、DMS/OMS+DVR架构,基于SAC8904的前视ADAS架构等创新方案,“我们的车载芯片出货量已超千万,未来将继续与产业链伙伴加大合作力度,加速实现汽车领域入门及腰部市...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...了全面的性能升级,其采用4000亿级参数MoE混合专家模型架构,是目前全球模型参数最大、性能最强的MoE模型之一。“天工3.0”的模型能力提升体现在以下四大方面:1、逻辑推理能力更强:更聪明逻辑推理能力的提升对于大模型...……更多
AI 面试:蓝海还是“难海”?
...的专业知识,以加强对上下文的理解。为此,以公司首席架构师 Dr. Laurence Lau 创造的 Talent-DNA 框架为基础,基于公司资深的 HR 行业专家知识,公司技术团队用结构化的形式总结人力资源知识,构建了自有知识图谱,通过带标签...……更多
...,引领了端到端自动驾驶研发的新趋势。但FSD V12的技术架构和复杂环境适应性需求对训练数据提出了更高的要求。数据的数量、质量和丰富度直接决定了算法的成熟度、安全性和商业化进程。“数据饥渴”正成为端到端自动驾...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...朝向之所以能够做到更自然的交互,和Gemini的原生多模态架构密不可分。Google解释了部分的训练细节。比如,Gemini的团队从一开始就针对不同的模态进行预训练,然后再使用额外的多模态数据对其进行微调,以进一步提升其能力...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
... AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型将于 Meta 公司 2024 年 7 月发布的 ……更多
西云算力举办AIGC沙龙,CTO梁峰分享“全系列全场景智算基础设施”
...OPS Utilization),即有效算力输出。梁峰指出,不同的模型架构、网络拓扑结构和优化策略都会影响这一指标,这考验着系统设计的功力,将会成为一个集群的核心竞争力之一。 白海科技联合创始人兼CEO卢亿雷从技术视角、落地...……更多
英特尔商用AI PC盛大起航 从芯出发向新而行
...杀手级应用,其不仅要求CPU和GPU更为强大,还要求计算机架构随之重构,引入高性能和低功耗的推理引擎。英特尔酷睿Ultra处理器,堪称是英特尔40年来最大的架构革新。英特尔酷睿Ultra处理器首次采用Intel4制程工艺结合先进的3DF...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...的任务执行,仍是当前尚未解决的问题。我们不仅需要使模型理解任务阶段本身,还需要从任务阶段的新角度重新审视多传感器融合。在一个复杂的操纵任务中完成将任务划分为不同阶段的一系列子目标的过程中,各个模态的数...……更多
国内首个热力行业多场景智慧客服系统发布
...、微信、数字人等场景的智慧客服系统(热力行业语言大模型)。该系统全面展示了人工智能与Deep Seek技术在智慧供热客服系统中的创新应用与实践,也是济南能源集团自主研发的国内首个ERP超融合管理平台供热板块的重要创新...……更多
...型厂商如OpenAI、谷歌、Mistral AI、浪潮信息等陆续基于MoE架构升级自家大模型产品的原因。从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。MM1.5提...……更多
加州大学团队开发异构编程新模型,开辟提升处理器性能新路径
...些困难,研究人员开发了一个由三个主要部分组成的系统架构:首先,SHMT 引入了一种虚拟硬件的概念,允许开发者将计算任务借助一系列虚拟操作(Virtual Operations,VOPs)的形式从 CPU“卸载”。VOPs 定义了 SHMT 底层硬件可支持的...……更多
AI大模型赋能交通:化身“数字运维专家”,融入车管电子书
...大型研究,协同探索人工智能发展创新。本次推出“有AI模型”系列报道,南都研究员与南方都市报“AI治理与创新智联体”专家一同走访广东人工智能大模型研发企业,看AI大模型如何赋能千行百业。第一期,走进广东省首批战...……更多
微软谷歌季绩揭示了什么?
...支为140亿美元,主要用于支持其云需求,包括扩展AI基础架构。用于设备、厂房和物业的现金支出为110亿美元。期内,来自经营活动的净现金流入为319亿美元,增长31%,主要受到强劲的云计算业务回款带动。自由现金流为210亿美...……更多
...高频服务事项,搭建了数千条公共资源交易领域问答知识架构。通过大模型持续标注和训练,支持“输入关键词即得全流程指引”一键触达,构建起覆盖交易全链条的标准化知识库。二是智能交互重构服务体验。“咨询小易”突...……更多
商汤大装置发布基于DeepLink的异构混合调度方案,加速国产算力从“可用”迈向“好用”
...过训练加速、异构通信、并行策略等核心技术,打破芯片架构差异带来的协同壁垒,重构计算资源调度体系。今年2月,上海AI实验室联合包括商汤在内的十余家合作伙伴,于上海建成了超大规模跨域混训集群原型,并已在千亿量级参数...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...功之处在于为图像视频等多模态数据找到了适合Transformer架构的表征方式,从而将ScalingLaw从语言模型复制到了图像视频模型。此外,Sora在训练时还借助了DALL·E3生成的高质量文本描述,在推理时借助了GPT对用户输入进行扩展,可...……更多
更多关于科技的资讯:
“数字之城”杭州如何驶入文旅发展新赛道?
中新网杭州12月18日电(曹丹)近日,《AI涌现——2025杭州数字文旅产业发展年度报告》在浙江杭州发布。报告显示,该市数字文旅骨干企业2025年前三季度营收同比增长10
2025-12-19 08:24:00
天立教育与腾讯教育达成战略合作,携手推动K12教育智能化升级
2025年12月16日,天立教育与腾讯教育达成战略合作。双方将深度融合腾讯的前沿AI技术能力,与天立启鸣在K12教育领域积累的教学经验与实践场景
2025-12-19 08:26:00
特步签约全运会冠军刘景扬,从耐力赛道到速度赛场的战略延伸
12月18日,中国领先体育用品品牌特步正式宣布第十五届全运会女子100米栏冠军刘景扬成为特步体育代言人。此次合作不仅是特步运动资源矩阵的拓展
2025-12-19 08:26:00
西交利物浦大学启用沉浸式球幕影院,MEGA创意媒体盛典与国际沉浸媒体联盟同步亮相
12月18日,西交利物浦大学影视与创意科技学院揭幕沉浸式球幕影院,并举办第五届MEGA国际创意媒体盛典,同时宣布国际沉浸媒体联盟正式成立
2025-12-19 08:26:00
协同作战、共创大美食材节,良之隆集团328百天倒计时动员会举行
12月18日,是良之隆・2026第十四届中国食材电商节的倒计时100天。在此之际,良之隆集团举办了3·28百天倒计时动员会
2025-12-19 08:26:00
马克思曾指出:“生产力是社会发展的最终决定力量。”AI作为第四次工业革命的重要推动力量,正用数据、算法和算力重构生产力的模样
2025-12-19 10:56:00
我国虚拟数字人领域首个国家标准《信息技术客服型虚拟数字人通用技术要求》近日正式发布。该标准的出台填补了行业技术规范的空白
2025-12-19 12:14:00
“有烟草证就能办纯信用贷款,50万元额度随借随还,这下旺季订烟的资金缺口彻底补上了!”上饶市余干县一家超市负责人李先生
2025-12-19 12:14:00
在数字经济与日常生活深度融合的今天,优质的服务体验已成为衡量企业核心竞争力的重要标尺。中国移动通信集团江苏有限公司无锡分公司(下称“无锡移动”)再次荣获国家级“用户满意服务”认证
2025-12-19 13:15:00
米连科技布局多元社交矩阵,满足不同情感连接场景
当提及线上社交平台时,许多人脑海中首先浮现的仍是“婚恋”或“约会”的单一标签。然而,米连科技通过其创新实践,正在系统性地打破这一固有印象
2025-12-19 13:58:00
浙江日报杭州12月18日讯 (记者 何冬健 通讯员 肖乐) 记者18日从之江实验室举办的021科学基础模型创新合作大会上获悉
2025-12-19 08:54:00
在共享经济与人工智能技术加速融合、新就业形态不断涌现的当下,如何规范发展、保障权益、激发创新活力成为关键。近日,由杭州高新区(滨江)市场监督管理局牵头起草的两项团体标准——《共享
2025-12-19 06:51:00
本报记者 程宬3000元本金、一张百货柜台、十来个工人,这是彭广杰2020年春天的全部家底;三年半后,他的PAOFU宠物用品旗舰店在拼多多日出5000单
2025-12-19 07:18:00
在工厂轻松搬运物料、在医院为患者做预诊、在赛场上竞速奔跑……2025年即将收官,“具身智能”以高票入选年度十大流行语榜单第二名
2025-12-19 07:18:00
出门问问打造的AIGC产品服务用户数已超1500万、江苏奥赛康研制的新型抗感染药物加速攻关……时至今日,在南京,一个个令人瞩目的成果背后
2025-12-19 07:18:00