• 我的订阅
  • 头条热搜
扩散模型训练方法一直错了!谢赛宁:Representation matters
...远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明,即使你只对生成像素感兴趣(例如使用扩散 Transformer 生成漂亮图片),也应该包含特征预测损失,以便解码器的内部表征...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
智东西9月13日消息,百度系统架构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异...……更多
本文转自:参考消息参考消息网6月12日报道 据美国趣味科学网站5月13日报道,麻省理工学院研究人员开发了一种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...序来缓解,但会增加计算成本。 2)效率:VALL-E的自回归架构绑定了与现成的音频编解码器模型相同的高帧率,且无法调整,导致推理速度较慢。虽然已经有多项研究用于改进VALL-E的这些问题,但往往会使模型的整体架构复杂化...……更多
英伟达超快stylegan回归
...024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下:具体到细节上,作者们对生成器、判别器和文本对齐权衡机制进行了重新设计,用FID对样本质量进行量化评估,并采用CLIP来对文本进行对...……更多
苹果公司公布“mm1”多模态大模型
...模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家(MixtureofExperts)架构及一种名为Top-2Gating的方法构建了MM1模型,号称不仅在预训练指标中实现了最好的性...……更多
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
...读】近日,Nous Research宣布了一项重大突破,通过使用与架构和网络无关的分布式优化器,研究人员成功将训练LLM时GPU间的通信量降低了1000到10000倍!如果可以使用世界上所有的算力来训练AI模型,会怎么样?近日,凭借发布了开...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...亚马逊云科技无疑是在Scaling Law为主旋律的当下妥妥的算力大玩家。其次,在模型层面上的战略,亚马逊云科技走的是一条“集大成者”的路线——当下每个大模型都各自擅长的能力,将它们集成到一起,方便客户选用。也正如...……更多
Meta 公司发布 Imagine Yourself AI 模型
...个文本编码器和一个可训练视觉编码器的完全并行注意力架构; 以及一个从粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像,同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练...……更多
手机市场深陷泥沼,厂商如何破冰?
...颈不断,手机厂商该如何破冰,进入下一个增长期?潮汐架构,一份关键答案性能不再是手机的瓶颈,前几年手机厂商都选择了新的影像赛道,通过与传统相机企业的携手同行,让高端手机市场迎来了新的增长机会。如今市面上...……更多
打造全新智算架构,神州鲲泰亮相深圳人工智能生态大会
...区。神州鲲泰全新智算产品亮相活动,并带来“全新智算架构”,以应对多云异构时代的智能算力挑战,神州鲲泰带来的智算产品和创新架构将为人工智能智算中心的打造提供强大助力。 尽精微,神州鲲泰“全新智算架构”...……更多
...扬清说,他的一个朋友告诉他,某国产大模型不过是LLaMA架构,只是更换了几个变量名而已。很快有好事者发现,在大模型、数据集开源社区Hugging Face上,就有一位开发者发出了类似质疑:“该模型使用了Meta LLaMA 的架构,只修...……更多
苹果发布mm1.5-ui模型
...了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。MM1.5提...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在……更多
阿里云CTO周靖人:全面投入升级AI大基建
...算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,...……更多
XAI大模型Grok-1已正式开源 但并不是在马斯克说的上周
...语言模型Grok-1已正式开源,发布了基本模型的权重和网络架构,有兴趣的用户可通过github.com/xai-org/grok上的指引使用。从xAI在官网公布的消息来看,Grok-1是拥有3140亿参数的混合专家模型。在目前已开源的大语言模型中,Grok-1的参...……更多
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...如何做到的?好用还得极速Yi-Lightning采用MoE混合专家模型架构。底层技术上,Yi-Lightning在以下方面进行了提升。 首先是优化混合注意力机制(Hybrid Attention),只在模型的部分层次中将传统的全注意力(Full Attention)替换为滑动...……更多
掰开安卓手机 满屏都是三个字:大模型
...同时功耗降低了40%。具体而言,HexagonNPU升级了全新的微架构。更快的矢量加速器时钟速度、更强的推理技术和对更多更快的Transformer网络的支持等等,全面提升了HexgonNPU对生成式AI的响应能力,使得手机上的大模型“秒答”用户...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...尺度物体,大到建筑,小到工具花草。 Hunyuan3D-1.0采用DiT架构,与混元DiT生图联合,支持原生中文,支持风格定制。其技术架构引入多视图扩散,借助二维数据优势提升3D泛化性,改进点包括:1、持续扩展数据规模、类目、质量...……更多
...战略——整车智能。比亚迪的整车智能,通过璇玑智能化架构,打破不同系统间的壁垒,做到实时捕捉内外部环境的变化,将信息汇总反馈到一个“大脑”进行思考决策,迅速调节车辆状态,大幅提升驾乘安全性和舒适性。比亚...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...而合,而且360更早就提出了“慢思考”的理念,并在技术架构和产品中都付诸了应用。同时,360还在其AI产品中强调多模合作,让来自不同厂商的大模型“抱团取暖”,为国内模型追赶OpenAI,找到了一条可行的道路。 从o1看大模...……更多
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...在于芯片级别的互联性特别高。苹果的技术论文表明,TPU架构可以开发更大、更复杂的AI模型。三大新模块炸裂出圈随着iOS18.1Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能。据悉,本次更新只支持M系和A17Pro芯...……更多
AMD举办AI PC创新峰会:150多家厂商支持
...AIPC变得更加智慧和人性化。AMD介绍了从2017年以来AMD在Zen架构上所取得的成就,从Zen架构开始,AMD的处理器迎来了拐点,而2019年的Zen2则是世界上第一个基于Zen2架构打造的处理器,而2022年AMD则推出了世界上第一个3D小芯片设计,...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...大规模算力集群来做训练。二是算法持续迭代,Transformer架构不能实现大一统,从稠密到稀疏模型,再到多模态模型的融合,多元架构持续演进并共存,面向特定领域设计的专用芯片难以适应未来算法,通用型算力才具备更强的...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...最强芯片亮相过去几年,英伟达曾在GTC上推出了基于Hopper架构的多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两...……更多
科技吉利创新吉利,吉利银河科技旗舰SUV“银河星舰”全球首发
... 北京报道4月25日,吉利汽车携自研的GEA全球智能新能源架构、银河11合1智能电驱、AI数字底盘、碳化硅混合驱动集成、天地一体化卫星科技等数十项行业最新、最热、最强的造车科技登陆2024北京国际车展,集中展示了吉利银河...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...现,从而大大降低了部署成本。 谷歌团队在重新设计的架构上构建了Gemma 2,使得这位Gemma家族的新成员既能提供卓越的性能,又具有高效的推理能力。简要概括一下,性能、成本、推理是它的突出特点:性能卓越:Gemma 2 27B模...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...有助于确定哪些知识可以存储为显式记忆,以及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...构建AIAgent来搭建自己的应用?在大模型时代,企业业务架构是否要进行智能化转型,架构应该如何部署和演进?在即将于6月21—22日在北京召开的WOT全球技术创新大会上,我们邀请数十位已经在大模型应用上起跑并领先半个身位...……更多
被质疑、抄袭、魔改,非主流大模型的诞生之路
...虎嗅注:RWKV创始人彭博是今天故事的主人公,在Transformer架构大行其道的当下,他一个人花了三年时间构建了RWKV架构,一种不同于Transformer架构的RNN架构。本文为虎嗅 《AI星火》系列 第 07篇稿件,《AI星火》系列聚焦AI细分行业...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00