• 我的订阅
  • 头条热搜
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...务中保持模型整体性能。之前各种知识编辑的模型方法和架构包括类似于:修改模型内部参数、增加额外参数和基于检索方法都会有冗长的编辑前缀影响推理效率。对模型本身进行微调可能会导致过拟合,从而影响其原始性能。...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...,Semi 赛道侧重于考验核心主干技术,即更多地关注模型架构的选择以及特征提取泛化能力,对多模态大模型技术技术积累以及创新性要求比较高。 针对赛道少标签数据、高技术要求的特征,Soul 团队基于此前积累的自研大模型...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...Pixtral都做了哪些工作。模型结构Pixtral 12B整体为Transformer架构,在大规模交错图像和文本文档上进行了预训练,具备多轮、多图像对话的能力。多模态解码器Pixtral的大语言模型主干选择了自家的Mistral Nemo 12B,decoder-only架构。内...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首...……更多
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...务器搭载 NVIDIA H20 GPU,6U8卡 NVLink,是基于全新一代 AI超融合架构平台,面向超大规模数据中心的强劲性能,极致扩展的AI服务器,最强算力密度6U空间内搭载1块 NVIDIA Hopper架构 HGX-8GPU模组,系统支持4.0Tbps网络带宽,满足万亿级参数超大模.……更多
蔚来智能驾驶研发部架构调整,探索端到端大模型?
...,据晚点LatePost报道,蔚来智能驾驶研发部于近日完成了架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...训练变得极为困难甚至无法实现。而大模型中 Transformer 架构的引入,则使模型具有高效的并行计算能力与灵活性,从而可以处理大规模数据集,并能通过微调预训练模型,快速适应不同任务场景。同时,其层次化结构能做到对...……更多
大模型“遍地”都是,谁能真正解放生产力?
...各自发挥了不同的价值。通用大模型解决基础性问题统一架构、统一模态、统一任务,而专用大模型解决专业领域知识问题,通过结合行业数据的预训练实现业务场景应用。而迫切寻求数字化转型的客户们需要的是,更精准、更...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...于设计更高效的基于 Margin 的损失函数或者更复杂的网络架构,以此来帮助卷积神经网络更好地捕捉细腻度的人脸特征。近年来,无监督学习和图神经网络的成功已经表明了数据结构在提升模型泛化能力中的重要性。大规模人脸...……更多
今日明星“端到端”,能否撑起智能驾驶的未来?|OpenTalk 回顾
...。直到2023年上海人工智能实验室发表的端到端自动驾驶架构UniAD获得CVPR 2023最佳论文、马斯克直播展示FSD,以及聚焦研发端到端自动驾驶系统的初创公司Wayve在2024年获10亿美元融资,各界才真的开始形成一个共识:端到端已经是...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...出得更早,方法更前瞻,落地应用也更快。他们所采用的架构,已经可以和o1匹敌,如果更新到下一代大模型,甚至还有可能实现领先。没错,这次周鸿祎和OpenAI所采用的路线殊途同归,不谋而合了。360首创的CoE架构,已经可以...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...用扩散模型(diffusionprobabilisticmodels)技术,基于Transformer架构,但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题,扩散模型用可扩展性更强的状态空间模型(SSM)主干替代了传统架构中的注意力...……更多
新一轮ai算力调度平台的重要性
...中,客户对于算力的需求、对应用的要求,以及对于底层架构都在发生变化。”青云科技总裁林源在接受记者采访时表示,新一轮的变化就是新一轮的机会。AI算力开启“数智化”时代,带来新机遇当前,自动驾驶、人脸识别、...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...它们可能有助于更有效地执行下游任务。图 2. ProMaC 整体架构 实现方法如图 2 所示,该研究提出了一个循环优化的 ProMaC 框架,它包括两部分:利用幻觉来从任务通用提示中推理出样本特有提示的 multi-scale chain of thought prompting ...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...韵、意境等方面,都能有精准的把控。完全自主研发,MoE架构,万亿参数在这次因为LiveBench又出来炸场一波之前,Step-2留给外界的最深刻印象,一定有一个是“国内首个由初创公司推出的万亿参数大模型”。这有点像阶跃风格的...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...成数据使任意语言模型具备语音交互能力。Mini-Omni 模型架构Mini-Omni 整体模型框架如下图所示,模型输入端可以是语音或文本,输出端同时包含文本和语音。为复用语言模型「预测下一个 token」的学习范式,输出侧语音采用离散...……更多
自研芯片三国杀,头部智驾新战场,蔚小理谁强?
...模型,理想为了解决端到端大模型可解释性差的问题,将架构升级为「端到端+VLM」,而小鹏则和特斯拉一样坚信纯视觉才是智能驾驶的终局,发布了下一代AI鹰眼纯视觉方案。但是要最大限度的发挥算法的能力,必须要有和软件...……更多
0提示词就能续写小说!彩云科技首创DCFormer架构大模型,AI秒变网文产粮神器
...沟通会上,AI技术公司彩云科技正式推出首款基于DCFormer架构开发的通用大模型“云锦天章”,旗下AI RPG平台“彩云小梦”也成为首款基于DCFormer架构开发的AI产品。与此同时,彩云科技CEO袁行远就AI大模型落地应用难、大模型未...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...科学家林达华。过去一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...工智能基础模型迫在眉睫。智谱AI于2020年底研发GLM预训练架构,三年多来始终坚持全自研路线,新一代基座大模型GLM-4是智谱 AI专注于大模型创新的最新成果。智谱 AI愿与人工智能行业所有的参与者、产业链上下游合作伙伴、开...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...处理。 计算模拟训练可以快速探索、验证和测试各种PNN架构,有助于在进行实际的物理建构之前提高PNN的准确性和功能性。这种方法不仅速度更快,成本效益更高,无需为每次设计迭代建立和优化昂贵而耗时的物理系统,还具...……更多
光芯片再次突破!清华大学研制出“太极-II”光训练芯片:首创全前向智能光计算训练架构【附光芯片行业现状分析】
...琼海院士课题组另辟蹊径,首创了全前向智能光计算训练架构,研制了“太极-II”光训练芯片,实现了光计算系统大规模神经网络的高效精准训练。该研究成果以“光神经网络全前向训练”为题,于北京时间8月7日晚在线发表于...……更多
围绕算力+数据,矩阵起源建设开源 AI 原生软件平台
...语言交互能力撼动了整个世界。之后十几个月,Transformer架构和大语言模型LLM成为划时代的技术,激发了整个AGI领域的创业和创新。OpenAI和Google相继推出了GPT-4o、ProjectAstra等「AI全家桶」、字节跳动发布「豆包」大模型家族、腾...……更多
利润暴涨628%,AI霸主英伟达全产业链投资图鉴|智氪
...,要关注哪些产品?根据英伟达官网披露,在每一代的GPU架构下,公司会将旗下的GPU按品牌分类进入GeForce、NVIDIA RTX/Quadro、数据中心三个品类。其中,GeForce系列主要应用于游戏行业,属于消费级GPU;NVIDIA RTX/Quadro主要应用于工业...……更多
比AI更热的行业,跑出了头部选手
...技术也正在迎来技术变革。那么首先要变革的,就是底层架构。在车辆的电子电气架构方面,特斯拉是早期变革者,在2012年 Model S有较为明显的功能域划分,包括动力域、底盘域、车身域, ADAS模块,到2017 年特斯拉又在Model3 突...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...中文能力已追平GPT-4。多模态能力层面,混元文生图基础架构全面升级至Sora同款DiT架构,成为国内首个中文开源文生图Dit架构的大模型。为服务大模型产业发展,腾讯云推出大模型训练“黄金三件套”。新一代HCC高性能计算集群...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...a这样的大型Transformer提炼成了Mamba模型, 并且成功在Mamba架构上应用了带有硬件感知的推测解码算法,提高了整个模型的推理速度。为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...现,从而大大降低了部署成本。 谷歌团队在重新设计的架构上构建了Gemma 2,使得这位Gemma家族的新成员既能提供卓越的性能,又具有高效的推理能力。简要概括一下,性能、成本、推理是它的突出特点:性能卓越:Gemma 2 27B模...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
更多关于科技的资讯:
2025“星耀巴南·菁储行未来星”人才计划首站走进重庆科技大学
3月7日,巴南软件园&重庆数字经济人才市场巴南市场携手巴南优质软信和数字经济企业开启2025“星耀巴南·菁储行未来星”人才计划首站——重庆科技大学
2025-03-10 23:08:00
蔚来李斌:别人家孩子都已经上大学了 我们还在复读
快科技3月10日消息,据36氪汽车报道,今年2月25日,一名即将离职的蔚来员工发长文吐槽,提出十条建议,呼吁公司应尽快从务虚转化为务实
2025-03-10 23:18:00
李想亮相湖南卫视节目:我比所有做汽车的更懂互联网
在湖南卫视近日播出的《夺金2025》创业节目中,六名青年创客抵达了北京理想汽车总部,开展了多维度的研学实践。作为理想汽车CEO
2025-03-10 23:18:00
深圳机器人跑步惊呆歪果仁 与人类无异 网友:北马见
国产机器人,再次惊呆了歪果仁。这一次,靠的是像极了人类的跑步姿势,来感受一下这个feel:这便是深圳众擎机器人最新发布的视频
2025-03-10 23:18:00
劳力士手表价格暴跌 有人卖块表赔了一台保时捷
快科技3月10日消息,据报道,二手劳力士手表价格近期正在持续下跌。“熊猫迪”已从40万元跌到19万元,一些型号更是跌破了劳力士发行的公价
2025-03-10 19:48:00
182.3米世界坝体最高!江苏句容抽水蓄能电站3号机组并网发电
快科技3月10日消息,据央视新闻报道,今天位于江苏句容市的国网新源江苏句容抽水蓄能电站3号机组正式并网发电。至此,该站首批3台机组已全部投运
2025-03-10 19:48:00
出色影像加持,华为nova 13 Pro氛围感照片触手可得
在这个时代,一张好看的照片胜过千言万语。你是否曾经因为拍不出美照而错失记录生活的机会?是否曾因为不会给女朋友拍照而被嫌弃
2025-03-10 19:48:00
网友买到三只松鼠发霉面包要求道歉 客服:赔偿2000元 道歉信没有
近日,据媒体报道,有网友买到三只松鼠发霉面包。该网友称,该发霉面包是从三只松鼠电商旗舰店购得,入口后闻到臭味,发现面包发霉现象
2025-03-10 19:48:00
网友脑洞大开!华为Pura 80鬼才设计图曝光
快科技3月10日消息,有网友放出了一张华为Pura 80的“鬼才设计图”,其最大看点是镜头模组是四分之一圆,四台手机组合在一起就能拼成一个完成的圆形
2025-03-10 19:48:00
对话全国政协委员、康希诺朱涛:疫苗出海需创新与差异化,国家免疫规划扩容是必然趋势
“我们不可能一天就把免疫计划扩容到跟发达国家一样多的品种。随着国内企业在疫苗供给、疫苗质量和技术水平方面的逐步提高,国家免疫规划扩容必然会来临
2025-03-10 19:54:00
秒“算”神机,西部大山为“哪吒”生出澎湃算力|贵州有“数”
据网络平台数据:《哪吒之魔童闹海》(《哪吒2》)全球电影票房(含预售及海外)超越《复仇者联盟3:无限战争》进入全球票房榜前6名
2025-03-10 20:15:00
13万就有激光雷达智驾!零跑B10搭同级唯一高通8650智驾芯片
快科技3月10日消息,零跑汽车今日晚间举办零跑B10预售发布会。零跑汽车介绍,B10为13万级首搭激光雷达高阶智驾的车型
2025-03-10 20:18:00
“县城贵妇”们开始纷纷加入二手经济
快科技3月10日消息,近日,转转集团发布2024女性二手消费洞察。数据显示,2024年转转平台女性用户同比增长70%,女性用户在高价值品类的交易中占比显著提升
2025-03-10 20:18:00
10倍长!微信正式官宣:朋友圈可以发5分钟视频了
快科技3月10日消息,微信,作为我们日常生活中不可或缺的社交工具,一直在不断创新和优化,为用户带来更加丰富的使用体验。以往
2025-03-10 20:18:00
鲁网3月10日讯(记者 陈珊珊 通讯员 韩巧苓)在人工智能技术飞速发展的当下,楼宇经济作为城市产业的关键支撑,正面临着数字化
2025-03-10 20:43:00