• 我的订阅
  • 头条热搜
智能驾驶的「 ChatCPT 时刻」,这么近,那么远
...。让他发出感叹的方案,就是如今风靡整个行业的端到端架构。尽管几年前,端到端架构在自动驾驶领域的运用已经出现在英伟达论文中,但正式落地使用还是从特斯拉的这次转变开始。 什么是智能驾驶的端到端架构呢?严格...……更多
字节豆包团队推出稀疏模型架构UltraMem:推理成本可降83%
...tion团队近日宣布了一项重要创新成果——UltraMem稀疏模型架构。这一架构通过将计算和参数解耦,在保证模型效果的同时,有效解决了推理过程中的访存问题,为人工智能领域带来了新的突破。据了解,UltraMem架构巧妙地将计算...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无预兆地,Meta版Sora——Movie Gen,就在刚刚抢先上线了!Meta将其称为「迄今最先进的媒体基础模型」。全新上线的大杀器Movie Gen Vi...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...。但是别被Scaling Law局限,参数小不意味着能力弱,模型架构的重要性应该重新进入我们的视线。MobileLLM不仅在同等大小的模型中达到了SOTA性能,而且提出,架构的深度比宽度更重要。一个「深而窄」的「瘦长」小模型同样可以...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...作者将 MMCL 方法分为四类主要方法,即基于正则化、基于架构、基于重放和基于提示的方法。基于正则化的方法:由于训练中参数的自由移动导致灾难性遗忘,基于正则化的方法旨在对参数施加约束来减少遗忘。 基于架构的方...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...经过多年的发展,逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态,开源模型在选择LLM主干、视觉编码器以及训练数据方面都存在差异,性能优异的闭源多模态大模型也没有公布相关...……更多
架构优先、先易后难,华为的制造业生成式AI方法论
...投入大的挑战,华为中国政企业务副总裁郭振兴提出了“架构优先、先易后难,化零为整,缓进急战”十六个字原则,加速推进AI与制造行业深度融合的进程。基于统一平台,将AI大模型应用逐步落地在向制造强国的迈进过程中...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...使用了哪些数据?其中有多少合成数据?为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的?我们什么时候可以见到Llama 4?Meta是否会发展agent?恰逢Llama 3.1刚刚发布,Meta科学家就现身播客节目Latent Sp...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...究团队提出了轨迹基础模型的构建范式,旨在通过其模型架构设计和数据集支撑的流程,克服现有方法的局限性,实现跨任务、跨区域的泛化能力,并在不同数据质量下保持鲁棒性。具体来说,研究团队首先收集了一个全球范围...……更多
中国算力大会启幕  联想举办异构智算产业生态联盟技术论坛
9月27日,2024中国算力大会在河南郑州拉开帷幕。作为全球领先的算力基础设施和服务提供商,联想集团参会参展并携手异构智算产业联盟承办2024异构智算产业生态联盟技术论坛。论坛发布了新一代AI服务器、AI应用部署解决方...……更多
...的360通过其首创的CoE(Collaboration of Experts,专家协同)技术架构及混合大模型对“慢思考”进行落地实践,该技术架构已落地在360 AI搜索、360 AI浏览器等多款产品中。AI助手通过CoE架构还接入了很多小参数专家模型,在回答简单问...……更多
阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
...型,但后来有朋友告知,这个大厂新模型完全就是LLaMA的架构,但为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。此外,海外也有工程师直接指出了这一点。“我们是小公司也不想得罪大佬...……更多
豆包大模型1.5 Pro正式发布:比GPT-4o更强
...训练,训练成本极低,但性能不打折,采用大规模稀疏MoE架构,等效7倍激活参数的Dense模型性能,远超业内MoE架构约3倍杠杆的常规效率。官方强调,模型训练过程中,未使用任何其他模型生成的数据,扎实不走“捷径”。【本...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...材”可以帮助大模型更好地适应不同类型的问题。模型的架构和训练过程,包括模型大小和训练超参数的选择,对于模型性能很重要,可以理解为在“建造大模型大楼”的过程中,需要选择“合适的建筑材料”和“施工方法”。...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...86B等。MoE(Mixture of Experts)是业界最前沿的混合专家模型架构 ,将多个细分领域的专家模型组合成一个超级模型,打破了传统扩展定律(Scaling Law)的局限,可在扩大模型规模时,不显著增加训练和推理的计算成本,保持模型性...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...igurable Dataflow Unit)为代表的动态可重构数据流(Dataflow)架构的芯片,能够通过并行处理和高效数据移动来优化性能和效率,近年越来越被认为是一个重要的发展方向。数倍于 GPU 推理性能来自 SambaNova 最新一代 RDU SN40L近日的芯...……更多
视频生成群雄逐鹿,哪些重要问题待解?
...学人工智能研究院助理教授晏轶超,新壹科技AI算法主任架构师李璋,井英科技联合创始人、CTO王健,旷视研究院高级研究员李华东5位青年学者和技术专家带来报告,将围绕视频大模型架构比较、三维数字人视频生成、面向数字...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...于设计更高效的基于 Margin 的损失函数或者更复杂的网络架构,以此来帮助卷积神经网络更好地捕捉细腻度的人脸特征。近年来,无监督学习和图神经网络的成功已经表明了数据结构在提升模型泛化能力中的重要性。大规模人脸...……更多
智驾的遮羞布被掀开
...线没有了标准答案。理想在 AI TALK 上公布下一代自动驾驶架构 VLA(视觉-语言-行为大模型);小鹏最新技术架构则是打造一个云端世界基座模型,通过蒸馏方法,生产出小尺寸的车端模型XVLA;华为乾崑ADS4 引入了 WEWA 架构——WE...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量,其速度最多可提高26%。通过使用YaFSDP缩短大型语言模型的训练时间,可以节省高达20%的图形处理器资源。Yandex公司高级开发人员、YaFSDP开发团队成员米哈...……更多
谷歌推出aihypercomputer超级电脑架构
...语言模型Gemini1.0、云端AI芯片TPUv5p外,还推出了超级电脑架构AIHypercomputer。获悉,AIHypercomputer电脑架构号称“软硬结合”,整合了为AI优化的硬件、开源软件、主流深度学习框架,并号称采用灵活的定价模式,便于商业及研究部...……更多
...成更困难、更复杂的任务。“空天·灵眸”3.0版内核工作架构是基于热传导,这是联合团队自主研发的一套小而精的原创性架构。受传热学物理思想启发,联合团队将场景目标间视觉语义传播建模为热能扩散过程,从而使该架构...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰手机树立全新的技术标杆,并为消费者带来刷新标准的创新旗舰体验发布...……更多
meta推出“v-jepa”视频预测模型
...Cun在2022年推出了JEPA(JointEmbeddingPredictiveArchitectures)模型架构,次年基于JEPA架构开发了一款“I-JEPA”图片预测模型,目前又推出了一款名为“V-JEPA”的视频预测模型。据介绍,相关JEPA架构及I-JEPA/V-JPA模型主打“预……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...以及剑桥大学的研究者联合提出了一种全新的非对称 LoRA 架构 —— HydraLoRA。与传统 LoRA 需要对所有任务使用相同的参数结构不同,HydraLoRA 引入了共享的 A 矩阵和多个独立的 B 矩阵,分别处理不同的任务,从而避免任务间的干扰...……更多
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
...一个模型,同时胜任所有任务?近些年来,包括Transformer架构在内的一系列工作,虽然在细分任务上展现出色的性能,但由于缺乏灵活和通用的时序特征的提取能力,无法成为通用的模型架构。为了解决这些问题,来自MIT、港科...……更多
RNN回归!Bengio新作大道至简与Transformer一较高下
...学习三巨头之一的Yoshua Bengio,带领团队推出了全新的RNN架构,以大道至简的思想与Transformer一较高下。在Transformer统治的AI时代之下,散落在世界各地的「RNN神教」信徒,一直相信并期待着RNN回归的那天:毕竟,凭借强大的顺序...……更多
遗憾不?百度早研究过Scaling Law,Anthropic CEO灵感都来自百度
...增加算力不能大幅提升模型的能力,那么就需要探索新的架构创新、算法优化或跨领域的技术突破。作为一个学术概念,Scaling Law 为人所熟知,通常归功于 OpenAI 在 2020 年发的这篇论文:论文标题:Scaling Laws for Neural Language Models ...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...出得更早,方法更前瞻,落地应用也更快。他们所采用的架构,已经可以和o1匹敌,如果更新到下一代大模型,甚至还有可能实现领先。没错,这次周鸿祎和OpenAI所采用的路线殊途同归,不谋而合了。360首创的CoE架构,已经可以...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...型大小)实现了更好的性能。最后,作者结合 Transformer 架构的最新进展,例如逐层缩放、使用 MoE 的稀疏 Transformer,以提高大规模训练的性能。作者提出的低成本训练 pipeline 减少了实验开销。除了使用真实图像,作者还考虑在...……更多
更多关于汽车的资讯:
9月27日,2025年太原能源低碳发展论坛在潇河国际会议会展中心开幕,作为论坛的重要组成部分——2025年山西(太原)能源产业博览会也于同日举行
2025-09-28 07:49:00
为追求亮度,有人私自给电动自行车装上强光灯,殊不知带来了安全隐患。9月26日,滨体社区举办的“电动自行车免费检修”活动中
2025-09-27 18:23:00
理想全新SUV正式发布 廊坊开发区交付中心同步启动新车交付
河北新闻网讯(李丽超)9月26日,理想汽车推出全新五座SUV车型——理想i6。该车型采用一体化外观设计,具备较长续航里程与快速补能能力
2025-09-26 20:43:00
中新经纬9月26日电 据商务部网站消息,商务部等四部门26日发布公告,决定对纯电动乘用车实施出口许可证管理。为促进新能源汽车贸易健康发展
2025-09-26 21:03:00
理想汽车五座SUV理想i6正式发布,零售价24.98万元起售
9月26日,理想汽车正式发布新形态五座SUV——理想i6。理想i6全国统一零售价24.98万元,并将于9月27日起正式开启交付
2025-09-26 21:15:00
仁怀:多重补贴激活汽车消费市场
多彩贵州网讯为贯彻落实中央、省、遵义市关于恢复和扩大消费的工作部署,仁怀市聚焦机动车消费领域,近日正式印发2025年机动车促销活动工作方案
2025-09-26 23:38:00
科技感拉满!分体式飞行汽车南京首展
9月25日,小鹏汇天“陆地航母”分体式飞行汽车南京首展落地河西金鹰世界,充满科技感的外观引得市民纷纷前来一睹真容,其独特的飞行与陆地行驶结合概念,展示了未来出行新可能。南京日报/
2025-09-26 07:41:00
双星、锦湖双双荣膺“亚洲品牌500强”,排名持续跃升
齐鲁晚报·齐鲁壹点记者 尚青龙9月24日,由世界品牌实验室(World Brand Lab)主办,以“全球关税壁垒背景下
2025-09-25 23:43:00
潍坊越野车场地赛暨“速度激情 魅力滨海”越野时尚嘉年华启幕
齐鲁晚报·齐鲁壹点 王钟玉九月的滨海秋高气爽,硕果累累。9月24日,“好运山东”“中国体育彩票”潍坊市第五届体育旅游消费季“阳春啤酒杯”2025潍坊越野车场地赛暨“速度激情 魅力滨海”越野时尚嘉年华在潍坊滨海区旅游度假区启幕
2025-09-25 22:04:00
乐享国庆丨开启您的城市微度假时光
预订RESERVATIONST : 0532 - 8098 8888更多优惠,进入微商城
2025-09-24 20:50:00
22万级华系插混王,传祺向往S9乾崑正式上市22.99万起 扫码阅读手机版
9月19日,传祺向往S9乾崑上市发布会在广汽集团广州番禺总部举行。以华为乾崑、宁德时代、智电四驱三大全系标配、全员满配的舒享关怀及广汽大厂的品质保障
2025-09-23 20:45:00
冲刺三季度 决胜下半年丨湖北秀山科技:突破核心技术 产品远销亚欧
十堰广电讯(全媒体记者 何旭 通讯员 冯倩钰)科技创新与产业创新深度融合,对于抢占竞争制高点、把握发展主动权具有重要意义
2025-09-23 21:33:00
冲刺三季度 决胜下半年丨深圳东风(十堰)汽车:专利变红利 产销同比翻番
十堰广电讯(全媒体记者 魏俊 通讯员 彭海溢)在深圳东风(十堰)汽车有限公司,80多辆城市环卫用车整齐排列,包括桶装垃圾车
2025-09-23 21:33:00
一汽-大众首批出口车辆正式下线
9月23日,一汽-大众在长春基地举行首批出口车辆下线仪式,554辆迈腾、速腾将于9月28日从上海港发出,11月份在中东上市
2025-09-23 22:06:00