• 我的订阅
  • 头条热搜
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...均达到突破性的满分100分,为国内首次。下一代基础模型架构Qwen3-Next及系列模型正式发布,模型总参数80B仅激活 3B ,性能即可媲美千问3旗舰版235B模型,实现模型计算效率的重大突破。Qwen3-Next针对大模型在上下文长度和总参数...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...工智能基础模型迫在眉睫。智谱AI于2020年底研发GLM预训练架构,三年多来始终坚持全自研路线,新一代基座大模型GLM-4是智谱 AI专注于大模型创新的最新成果。智谱 AI愿与人工智能行业所有的参与者、产业链上下游合作伙伴、开...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...a这样的大型Transformer提炼成了Mamba模型, 并且成功在Mamba架构上应用了带有硬件感知的推测解码算法,提高了整个模型的推理速度。为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关...……更多
滴普科技董事长兼CEO赵杰辉:从数据驱动到智能驱动,大模型释放数据平台全新生产力|WISE2023商业之王大会
...度释放生产力。他认为,未来,整个企业领域的数据智能架构将基于数据的基础设施建设,加上基于大模型的AI Agent,形成一个新的数字经济体架构。演讲正文如下:大家好,非常荣幸有机会在36氪WISE平台上跟大家分享我们的行...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...,作为百川智能的首个MoE模型,Baichuan4-Air 行业首创了PRI架构,巧妙融合了Pyramid(金字塔架构)、Residual(残差结构)、Interval(区间结构)三种配置方式。与标准的MoE架构相比,Baichuan4-Air的MoE架构保持了MLP(多层感知机)和Atte.……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
...同时在知识、数理、创作等方面也有突出表现。通过模型架构创新,Turbo S部署成本也大幅下降,持续推动大模型应用门槛降低。来源:腾讯云官网腾讯表示,“吐字快、秒回你的大模型,即将装进元宝。”针对为何要实现“秒...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
你敢想,AI 已经不满足只做程序员了,如今又向架构师这一进阶职业发起挑战。随着 AI 在研发领域的不断进化,能提供给工程师的助力越来越多,从原先单纯的编码加速器不断延展到架构理解、质量分析、安全扫描、测试生成...……更多
...有效的举措——自研AI Infra(AI Infrastructure人工智能基础架构技术)。AI Infra主要涵盖大模型训练和部署提供各种底层技术设施。在国外一线大厂,最高效训练模型的方式是算法与Infra共建,不仅关注模型架构,而是从优化底层训...……更多
京东云曹鹏:AI变革之下,大模型技术如何为企业未来赋能?
...练进入万亿参数级别,超大规模算力集群成为训练有竞争力大模型的基础。然而,面向具体业务场景时,通用大模型并不能完全满足所有需求。企业需要找到更有价值的场景,开发更有竞争力的行业大模型,并基于场景不断迭代...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...中文能力已追平GPT-4。多模态能力层面,混元文生图基础架构全面升级至Sora同款DiT架构,成为国内首个中文开源文生图Dit架构的大模型。为服务大模型产业发展,腾讯云推出大模型训练“黄金三件套”。新一代HCC高性能计算集群...……更多
...煤炭开采属于特殊高危行业,生产条件复杂,安全生产压力大。为了推动煤炭生产方式变革,近年来,我国大力推动煤矿智能化改造,让AI代替人在井下工作、决策,取得了显著效果。截至2024年1月,煤炭大省山西已经累计建成11...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
... 让图像生成技术触手可及,实现AI普惠随着扩散模型与AI架构的深度融合,图像生成技术迎来了指数级飞跃,其中文生图技术尤为显著。vivoAIGC图像大模型技术总监阮晓虎在论坛上介绍了vivo的文生图大模型——蓝心图像大模型Blu...……更多
高通打响围攻英特尔的第一枪
...定的是,两家公司的 PC 处理器同骁龙 X Elite 一样采用 ARM 架构。 英特尔曾凭借 x86 架构垄断 PC 处理器市场三十余年,但眼下英特尔的行业霸主地位,似乎在一夜之间迎来变数。高通的蜕变,有多彻底?在发布会开始,安蒙介绍...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...云打造的一站式智算平台产品——大云震泽智算平台,助力大模型训得更快、训得更稳。大云震泽智算平台针对千亿、万亿大模型训练所需,提供异构算力调度、万卡并行训练、断点自动续训、通智边一体化训推服务,承载训练...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...Hailuo 02还采用了创新的NCR(Noise-aware Compute Redistribution)架构。这一架构通过噪声感知机制,将计算资源按照需求分配给不同的区域。高噪声区域的信息密度较低,进行压缩处理;低噪声区域则分配更多的计算资源,重点捕捉关...……更多
蔚来智能驾驶研发部架构调整,探索端到端大模型?
...,据晚点LatePost报道,蔚来智能驾驶研发部于近日完成了架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...些集群算力指标上又有所提升。 此次,百舸 4.0 在整体架构上相较 3.0 版本有了略微调整,从底层硬件往上依次分为资源层、组件层、大模型加速层和工具层。四层架构,各司其职,针对大模型的训推、部署和调优等全流程进一...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...的 LLM 模型建立了新的 SOTA。 Llama 3 是如何炼成的?模型架构、预训练数据、扩大预训练规模和指令微调,是 Llama 3 成为最强开源 LLM 的四个关键要素。其中:1)模型架构Llama 3 采用了相对标准的纯解码器 transformer 架构。与 Llama ...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...29日一大早,阿里开源发布Qwen3,包括两款MoE(混合专家架构)模型,其中具备2350亿参数规模的Qwen3-235B-A22B,在对比测试中成为目前最强大的开源模型。此外,Qwen3还包括六款稠密模型,涵盖6亿、17亿、40亿、80亿、140亿和320亿等...……更多
扩散模型训练方法一直错了!谢赛宁:Representation matters
...远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明,即使你只对生成像素感兴趣(例如使用扩散 Transformer 生成漂亮图片),也应该包含特征预测损失,以便解码器的内部表征...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
智东西9月13日消息,百度系统架构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异...……更多
连发两款模型“补课”,百度AI成色如何?
...初步透露了多个层面的技术优化,包括注意力机制、模型架构、模型幻觉等方面。据介绍,文心4.5采用自研的FlashMask动态注意力掩码,降低了计算冗余和存储开销,可提升模型长序列建模能力和训练效率,优化了长文处理能力和...……更多
成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型
...新中心在技术创新上实现突破,于近日全国首发基于扩散架构的人形机器人高速推理模型 R-DDIRM(Denoising Diffusion Implicit Robot Model)。这是继今年 5 月推出中国首个基于扩散架构人形机器人任务生成式模型 R-DDPRM(Denoising Diffu……更多
本文转自:参考消息参考消息网6月12日报道 据美国趣味科学网站5月13日报道,麻省理工学院研究人员开发了一种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...序来缓解,但会增加计算成本。 2)效率:VALL-E的自回归架构绑定了与现成的音频编解码器模型相同的高帧率,且无法调整,导致推理速度较慢。虽然已经有多项研究用于改进VALL-E的这些问题,但往往会使模型的整体架构复杂化...……更多
英伟达超快stylegan回归
...024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下:具体到细节上,作者们对生成器、判别器和文本对齐权衡机制进行了重新设计,用FID对样本质量进行量化评估,并采用CLIP来对文本进行对...……更多
苹果公司公布“mm1”多模态大模型
...模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家(MixtureofExperts)架构及一种名为Top-2Gating的方法构建了MM1模型,号称不仅在预训练指标中实现了最好的性...……更多
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
...读】近日,Nous Research宣布了一项重大突破,通过使用与架构和网络无关的分布式优化器,研究人员成功将训练LLM时GPU间的通信量降低了1000到10000倍!如果可以使用世界上所有的算力来训练AI模型,会怎么样?近日,凭借发布了开...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...亚马逊云科技无疑是在Scaling Law为主旋律的当下妥妥的算力大玩家。其次,在模型层面上的战略,亚马逊云科技走的是一条“集大成者”的路线——当下每个大模型都各自擅长的能力,将它们集成到一起,方便客户选用。也正如...……更多
Meta 公司发布 Imagine Yourself AI 模型
...个文本编码器和一个可训练视觉编码器的完全并行注意力架构; 以及一个从粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像,同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练...……更多
更多关于科技的资讯:
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00
2025教室节能照明标杆盘点 四大品牌绿色护眼解决方案解析
在“双碳”目标引领下,校园节能改造成为教育领域绿色发展的重要方向。据住建部统计,商业建筑能耗中照明系统占比高达35%,学校作为人员密集
2025-12-06 16:09:00
海尔智慧家电亮相迪拜
11月26日至28日,中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中,海尔智家针对当地高温、多尘等特点,集中展示了洗衣机
2025-12-06 16:10:00
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础,与手机厂商在操作系统层面合作开发的AI助手软件
2025-12-06 17:41:00
文化中国行|全场听觉无死角 吉林省音乐厅声学揭秘
历经修缮重生的丰乐剧场,以“吉林省音乐厅”之名即将绽放春城。这座历史建筑,从伪满时期影剧院到音乐剧场的跨越,背后藏着一套极致考究的声学设计方案
2025-12-06 18:41:00
伊贝格:让机床行业不再为“头”烦恼
“关键核心技术与高端装备对外依存度高”一直是制约制造业升级的瓶颈。五轴联动铣头作为五轴机床的核心功能部件,过去很长一段时间被欧洲部分知名厂商垄断
2025-12-06 22:07:00
山东重工潍柴集团2026年商务大会圆满召开
鲁网12月6日讯12月6日,以“乘势向上 聚力向新”为主题的山东重工潍柴集团2026年商务大会在潍坊举行。山东重工集团党委书记
2025-12-06 22:43:00
近日,兴业数金上线投产跨境人民币理财项目,建立基于手机银行APP的“跨境理财通”线上功能专区,助力本行成为第二家实现“跨境理财通”业务全线上办理的内地商业银行
2025-12-06 16:08:00