• 我的订阅
  • 头条热搜
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...均达到突破性的满分100分,为国内首次。下一代基础模型架构Qwen3-Next及系列模型正式发布,模型总参数80B仅激活 3B ,性能即可媲美千问3旗舰版235B模型,实现模型计算效率的重大突破。Qwen3-Next针对大模型在上下文长度和总参数...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...工智能基础模型迫在眉睫。智谱AI于2020年底研发GLM预训练架构,三年多来始终坚持全自研路线,新一代基座大模型GLM-4是智谱 AI专注于大模型创新的最新成果。智谱 AI愿与人工智能行业所有的参与者、产业链上下游合作伙伴、开...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...a这样的大型Transformer提炼成了Mamba模型, 并且成功在Mamba架构上应用了带有硬件感知的推测解码算法,提高了整个模型的推理速度。为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关...……更多
滴普科技董事长兼CEO赵杰辉:从数据驱动到智能驱动,大模型释放数据平台全新生产力|WISE2023商业之王大会
...度释放生产力。他认为,未来,整个企业领域的数据智能架构将基于数据的基础设施建设,加上基于大模型的AI Agent,形成一个新的数字经济体架构。演讲正文如下:大家好,非常荣幸有机会在36氪WISE平台上跟大家分享我们的行...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...,作为百川智能的首个MoE模型,Baichuan4-Air 行业首创了PRI架构,巧妙融合了Pyramid(金字塔架构)、Residual(残差结构)、Interval(区间结构)三种配置方式。与标准的MoE架构相比,Baichuan4-Air的MoE架构保持了MLP(多层感知机)和Atte.……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
...同时在知识、数理、创作等方面也有突出表现。通过模型架构创新,Turbo S部署成本也大幅下降,持续推动大模型应用门槛降低。来源:腾讯云官网腾讯表示,“吐字快、秒回你的大模型,即将装进元宝。”针对为何要实现“秒...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
你敢想,AI 已经不满足只做程序员了,如今又向架构师这一进阶职业发起挑战。随着 AI 在研发领域的不断进化,能提供给工程师的助力越来越多,从原先单纯的编码加速器不断延展到架构理解、质量分析、安全扫描、测试生成...……更多
...有效的举措——自研AI Infra(AI Infrastructure人工智能基础架构技术)。AI Infra主要涵盖大模型训练和部署提供各种底层技术设施。在国外一线大厂,最高效训练模型的方式是算法与Infra共建,不仅关注模型架构,而是从优化底层训...……更多
京东云曹鹏:AI变革之下,大模型技术如何为企业未来赋能?
...练进入万亿参数级别,超大规模算力集群成为训练有竞争力大模型的基础。然而,面向具体业务场景时,通用大模型并不能完全满足所有需求。企业需要找到更有价值的场景,开发更有竞争力的行业大模型,并基于场景不断迭代...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...中文能力已追平GPT-4。多模态能力层面,混元文生图基础架构全面升级至Sora同款DiT架构,成为国内首个中文开源文生图Dit架构的大模型。为服务大模型产业发展,腾讯云推出大模型训练“黄金三件套”。新一代HCC高性能计算集群...……更多
...煤炭开采属于特殊高危行业,生产条件复杂,安全生产压力大。为了推动煤炭生产方式变革,近年来,我国大力推动煤矿智能化改造,让AI代替人在井下工作、决策,取得了显著效果。截至2024年1月,煤炭大省山西已经累计建成11...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
... 让图像生成技术触手可及,实现AI普惠随着扩散模型与AI架构的深度融合,图像生成技术迎来了指数级飞跃,其中文生图技术尤为显著。vivoAIGC图像大模型技术总监阮晓虎在论坛上介绍了vivo的文生图大模型——蓝心图像大模型Blu...……更多
高通打响围攻英特尔的第一枪
...定的是,两家公司的 PC 处理器同骁龙 X Elite 一样采用 ARM 架构。 英特尔曾凭借 x86 架构垄断 PC 处理器市场三十余年,但眼下英特尔的行业霸主地位,似乎在一夜之间迎来变数。高通的蜕变,有多彻底?在发布会开始,安蒙介绍...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...云打造的一站式智算平台产品——大云震泽智算平台,助力大模型训得更快、训得更稳。大云震泽智算平台针对千亿、万亿大模型训练所需,提供异构算力调度、万卡并行训练、断点自动续训、通智边一体化训推服务,承载训练...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...Hailuo 02还采用了创新的NCR(Noise-aware Compute Redistribution)架构。这一架构通过噪声感知机制,将计算资源按照需求分配给不同的区域。高噪声区域的信息密度较低,进行压缩处理;低噪声区域则分配更多的计算资源,重点捕捉关...……更多
蔚来智能驾驶研发部架构调整,探索端到端大模型?
...,据晚点LatePost报道,蔚来智能驾驶研发部于近日完成了架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...些集群算力指标上又有所提升。 此次,百舸 4.0 在整体架构上相较 3.0 版本有了略微调整,从底层硬件往上依次分为资源层、组件层、大模型加速层和工具层。四层架构,各司其职,针对大模型的训推、部署和调优等全流程进一...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...的 LLM 模型建立了新的 SOTA。 Llama 3 是如何炼成的?模型架构、预训练数据、扩大预训练规模和指令微调,是 Llama 3 成为最强开源 LLM 的四个关键要素。其中:1)模型架构Llama 3 采用了相对标准的纯解码器 transformer 架构。与 Llama ...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...29日一大早,阿里开源发布Qwen3,包括两款MoE(混合专家架构)模型,其中具备2350亿参数规模的Qwen3-235B-A22B,在对比测试中成为目前最强大的开源模型。此外,Qwen3还包括六款稠密模型,涵盖6亿、17亿、40亿、80亿、140亿和320亿等...……更多
扩散模型训练方法一直错了!谢赛宁:Representation matters
...远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明,即使你只对生成像素感兴趣(例如使用扩散 Transformer 生成漂亮图片),也应该包含特征预测损失,以便解码器的内部表征...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
智东西9月13日消息,百度系统架构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异...……更多
连发两款模型“补课”,百度AI成色如何?
...初步透露了多个层面的技术优化,包括注意力机制、模型架构、模型幻觉等方面。据介绍,文心4.5采用自研的FlashMask动态注意力掩码,降低了计算冗余和存储开销,可提升模型长序列建模能力和训练效率,优化了长文处理能力和...……更多
成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型
...新中心在技术创新上实现突破,于近日全国首发基于扩散架构的人形机器人高速推理模型 R-DDIRM(Denoising Diffusion Implicit Robot Model)。这是继今年 5 月推出中国首个基于扩散架构人形机器人任务生成式模型 R-DDPRM(Denoising Diffu……更多
本文转自:参考消息参考消息网6月12日报道 据美国趣味科学网站5月13日报道,麻省理工学院研究人员开发了一种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...序来缓解,但会增加计算成本。 2)效率:VALL-E的自回归架构绑定了与现成的音频编解码器模型相同的高帧率,且无法调整,导致推理速度较慢。虽然已经有多项研究用于改进VALL-E的这些问题,但往往会使模型的整体架构复杂化...……更多
英伟达超快stylegan回归
...024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下:具体到细节上,作者们对生成器、判别器和文本对齐权衡机制进行了重新设计,用FID对样本质量进行量化评估,并采用CLIP来对文本进行对...……更多
苹果公司公布“mm1”多模态大模型
...模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家(MixtureofExperts)架构及一种名为Top-2Gating的方法构建了MM1模型,号称不仅在预训练指标中实现了最好的性...……更多
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
...读】近日,Nous Research宣布了一项重大突破,通过使用与架构和网络无关的分布式优化器,研究人员成功将训练LLM时GPU间的通信量降低了1000到10000倍!如果可以使用世界上所有的算力来训练AI模型,会怎么样?近日,凭借发布了开...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...亚马逊云科技无疑是在Scaling Law为主旋律的当下妥妥的算力大玩家。其次,在模型层面上的战略,亚马逊云科技走的是一条“集大成者”的路线——当下每个大模型都各自擅长的能力,将它们集成到一起,方便客户选用。也正如...……更多
Meta 公司发布 Imagine Yourself AI 模型
...个文本编码器和一个可训练视觉编码器的完全并行注意力架构; 以及一个从粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像,同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练...……更多
更多关于科技的资讯:
近日,兴业数金上线投产跨境人民币理财项目,建立基于手机银行APP的“跨境理财通”线上功能专区,助力本行成为第二家实现“跨境理财通”业务全线上办理的内地商业银行
2025-12-06 16:08:00
“我是一名肢残三级的残疾人,请问能享受哪些补贴?”输入文字,几秒钟过后,手机页面就出现了答案——杭州市各级政府的相关助残政策和补贴金额被清晰地列举出来
2025-12-06 10:21:00
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00
烟台南山学院斩获省部级科技奖荣誉
近日,2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”
2025-12-05 15:00:00
盐城盐都:“芯”智散热赋能 科创驱动前行
江南时报讯 以科创破局散热赛道,以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮,盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势
2025-12-05 15:07:00
中新建电力集团发电产业:智慧电厂新蓝图
近日,中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级,上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划
2025-12-05 15:09:00
日前,建行河北省分行2025年“人工智能+”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛,经过严格的初审选拔
2025-12-05 15:09:00
全国首台套!助力煤矸石全量高值转化
12月1日,由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运
2025-12-05 15:10:00
如何“反内卷”?54.5%职场人将“优化薪酬激励机制”列为首选
什么是“好工作”?工作有哪些特质会让员工有“好”感受?日前,智联招聘通过问卷调研的方式,对平台用户展开调研,回收3525份有效样本
2025-12-05 15:26:00
国航举办“国航+”生态主题发布会
海外网北京12月5日电(记者严冰)12月5日,中国国际航空股份有限公司(以下简称“国航”)在北京举办“云端无界 凤启耀星河——‘国航+’生态主题发布会”
2025-12-05 15:33:00
乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业!
12月5日,国内仓储式品牌特卖开创者荟品仓,在房山区瑞来广场盛大开业,带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣
2025-12-05 15:55:00
易生支付“智慧分账”赋能安心鲜生 驱动社区零售全国布局
在社区零售数字化转型加速深化的背景下,易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力
2025-12-05 16:09:00
ED用药怎么选?金钢鸟领衔西地那非口崩片品牌阵营,购买渠道全解析
第91届全国药交会上,金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相,让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点
2025-12-05 16:09:00
苏州黄埭镇推动“产学研”深度融合
江南时报讯 日前,苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作,联合启动轮式双臂机器人研发项目,致力于推动创新成果向现实生产力加速转化
2025-12-05 16:13:00
近邻碰碰:以 “邻里经济”打造智慧社区消费新生态 —— 专访小门神传媒科技集团董事长付信中
鲁网12月4日讯“远亲不如近邻”,这句家喻户晓的俗语,如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备
2025-12-05 16:47:00