• 我的订阅
  • 头条热搜
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
【新智元导读】谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。谷歌DeepMind的小模型,又上新了!就...……更多
...然图像是一个重要的里程碑。QST研究人员称,人类已使用显微镜和其他设备来观察肉眼看不见的世界,但还无法看到一个人的内心世界,这是人类第一次窥视另一个人头脑中的思想。从本质上讲,它可用来帮助创建新的通信设备...……更多
世界上第一项针对人工智能“大脑”的研究,剖析并编辑它的思想
...人员使用一种名为“字典学习”的技术,通过“稀疏自动编码器”,开始尝试将“神经元激活”的模式与人类熟悉的概念和想法相匹配。去年年底,他们在极小的“玩具”版本的语言模型上取得了一些成功,发现了模型在处理DNA...……更多
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
...解大型语言模型如何工作方面取得了突破性进展:稀疏自编码器(SAE)在其激活空间中发现了大量可解释为概念的点(「特征」)。最近,此类 SAE 点云已公开发布,因此研究其在不同尺度上的结构正当其时。最近,来自 MIT 的...……更多
稀疏自编码器是如何工作的,这里有一份直观说明
...阵 → ReLU 激活 → 矩阵在解释机器学习模型方面,稀疏自编码器(SAE)是一种越来越常用的工具(虽然 SAE 在 1997 年左右就已经问世了)。机器学习模型和 LLM 正变得越来越强大、越来越有用,但它们仍旧是黑箱,我们并不理解...……更多
...精细化覆盖。最内层“1公里×1公里”的网格犹如“环境显微镜”,能够敏锐捕捉街道级别的污染变化特征。为了让模型更加“聪明”,不需人工干预,就可以定时定点智能计算,在前期系统的开发上,创蓝科技针对南京的地形...……更多
...式的跨越。文|闻静功能性磁共振成像(fMRI)是一种测量大脑活动的非侵入性方法,原理是通过刺激特定感官,激活大脑皮层相应部位的神经,并通过磁共振图像来显示。近日,科学家将fMRI与大型语言模型(LLM:一种人工智能算...……更多
谷歌 AI 绘画 4 大牛携手创业,天使估值 7 个亿
...含一个冻结的语言模型T5-XXL(谷歌自家出品),当作文本编码器。T5-XXL的C4训练集包含 800GB 的纯文本语料,在文本理解能力上比CLIP强不少,因为后者只用有限图文对训练。图像生成部分则用了一系列扩散模型,先生成低分辨率...……更多
扩散模型训练方法一直错了!谢赛宁:Representation matters
...究表示了认可:「我们知道,当使用自监督学习训练视觉编码器时,使用具有重构损失的解码器的效果远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明,即使你只对生成像...……更多
...任程和平院士介绍,团队通过自主研发的双侧扫描双光子显微镜,首次实现SCN区域近万颗神经元跨昼夜的钙成像。研究发现,SCN中以钙脉冲为基本单元,可形成从秒到小时到近日周期的跨尺度钙信号,展示出潜在的时间编码能力...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...纽约大学的Yann LeCun的转发。当使用自监督学习训练视觉编码器时,我们知道一个事实,使用具有重建损失(reconstruction loss)的解码器的效果远远不如具有特征预测损失(feature prediction loss)和崩溃预防机制的联合嵌入架构。 这...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...过程。 语义遵从:业界首个以多模态大语言模型为文本编码器的视频生成模型,天然具备超高语义理解能力,在处理多主体及属性绑定等生成领域的难点挑战时表现出色。 原生镜头转换:多视角镜头切换主体保持能力,艺术...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...GPT是一种创新的时空大型语言模型,它通过结合时空依赖编码器和指令微调技术,展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖,即使在数据稀缺的情况下也能提供准确的...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...预训练的视觉表征重要吗?该团队使用不同的预训练通用编码器作为世界模型的观察模型,并评估了它们的下游规划性能。 在涉及简单动态和控制的 PointMaze 任务中,该团队观察到具有不同观察编码器的世界模型都实现了近乎...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
...够了解 Gemma 2 模型的决策过程。Gemma Scope 就像一台强大的显微镜,它使用稀疏自编码器 (SAE) 放大模型的内部工作原理,使其更易于解释。Gemma Scope 技术报告:https://storage.googleapis.com/gemma-scope/gemma-sc……更多
300次实验磨一剑!南京空气质量预报添利器守护蓝天“显微镜”,预报细至1公里南报网讯(记者杜莹)守护蓝天白云的科技力量在南京再次升级。近日,由江苏省南京环境监测中心携手南京创蓝科技有限公司打造的“南京市空...……更多
轻量化模型架构catvton的优势在哪里
...著帮助的文本交叉注意力,同时也不需要任何额外的图像编码器来辅助生成。 下表详细地比较了不同方法与CatVTON的模块数量、参数量、可训练参数量、显存占用、推理条件。在网络模块上,CatVTON只需要VAE+UNet,无需任何额外的...……更多
阿里开源版Sora上线即屠榜 4070就能跑 免费商用
...。那么,Wan 2.1是如何实现又好又省的呢?创新3D变分自动编码器和主流的视频生成技术路线一样,Wan 2.1的主体采用了DiT(Diffusion Transformer)架构。Wan利用T5编码器对输入的多语言文本进行编码,并在每个Transformer块内加入交叉注...……更多
谷歌发布 MediaPipe Diffusion 插件
...入到文本转图像的扩散过程中。2.ControlNet会创建扩散模型编码器的一个可训练副本,通过零初始化参数后的卷积层连接,将传递到解码器层的条件信息进行编码。3.T2IAdapter是一个较小的网络(7700万参数),在可控生成中可以实...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...长图形设计。与传统依赖于预训练语言模型如T5或CLIP文本编码器的文本到图像生成模型不同,PGv3完全集成了大型语言模型(LLMs),基于全新的深度融合(Deep-Fusion)架构,利用仅解码器(decoder-only)大型语言模型的知识,来进...……更多
150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024
...离与重建的过程中实现语音特征解耦。如图3所示,包括编码器(Encoder)、多层残差向量量化器(Residual Vector Quantizers, RVQs)、解码器(Decoder)、鉴别器(Discriminator)四个核心部分。其中,RVQs主要包括级联的八层量化器,在第...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...练过程就是基本的「预测下一个词」,不过「词」是通过编码器从语音或文本中提取的,然后通过解码器以原来的模态进行重新呈现;训练数据包括三种:仅包含文本的序列、仅包含语音的序列以及交错的语音-文本序列的混合...……更多
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...资料看,腾讯混元视频生成模型还有三个亮点。1、文本编码器部分,已经适配多模态大模型当下行业中多数视觉生成模型的文本编码器,适配的主要是上一代语言模型,如OpenAI的CLIP和谷歌T5及各种变种。腾讯在开源图像生成模...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...律性。 动态交通模式:除了周期性变化外,作者的时间编码器还捕捉交通数据随时间演变的复杂、非线性时态动态和趋势。周期性交通转换建模作者利用时间嵌入D和空间嵌入C捕获交通中的周期性模式,目标是揭示历史交通模式...……更多
华人团队爆火instructblip抢跑看图聊天
...方法。如上图所示,Q-Former被设计用来从一个冻结的图像编码器的输出中提取视觉特征。根据BLIP-2的论文,Q-Former已经分成两个阶段进行了预训练,通过预训练,它学会了提取可以被LLM消化的文本对齐的视觉特征。在推理过程中...……更多
科大讯飞构建全新语音建模框架 降低AI声音复刻门槛
...突破了语义表征,采用mel VQ-AE模型结合语音自监督预训练编码器,并引入音色最小互信息约束,成功解耦出音色无关的离散语义token。这种结构实现了发音内容与音色特征的可控分离,也显著提升了语义LLM的建模稳定性。在音色...……更多
...入深度学习算法的不同层中。在时间序列上,该模型采用编码器-解码器结构,起报时间之前是编码阶段,模仿CTM的spin-up过程;解码阶段则模仿CTM 的预报过程,并加入数值预报模式预报特征作为约束。该研究在编码阶段借鉴了传...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...础模型 UniTraj在模型的架构设计上,UniTraj 采用了灵活的编码器 - 解码器架构,为了提升模型的计算效率、鲁棒性和对各种数据质量的适应能力,作者在模型训练过程中进一步集成了一系列的重采样策略和掩码策略。重采样策略...……更多
微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型,实现高质量的语义分割任务
...器进行微调。在语义分割中,可以将已经训练好的模型的编码器部分用于新任务,然后在新任务上训练新的解码器,并帮助利用已有的大规模标注数据集来训练模型,从而减少对新数据集的标注需求,提高模型性能。WIMI微美全...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...型架构根据介绍,Ferret 主要由用于提取图像嵌入的图像编码器;用于提取区域连续特征的空间感知视觉采样器;以及用于对图像、文本和区域特征进行联合建模的大语言模型组成。输入将图像输入经过预训练的视觉编码器 CLIP-Vi...……更多
更多关于科技的资讯:
参半出席中国口腔新健康行动“全国爱牙日”活动 共筑国民口腔健康防护基石
9月19日,“中国口腔新健康行动・2025年全国爱牙日”活动在人民网演播厅举办。活动现场,中国口腔清洁护理用品工业协会
2025-09-22 11:44:00
CICAS组委会联合知乎开启第三届全国人工智能应用场景创新挑战赛AGI专项赛
9月20日,以“AI之下,科技重构”为主题的知乎首届TechClub新知科技大会在杭州拉开帷幕。学界专家、企业高管、AI开发者
2025-09-22 11:52:00
于都“织”出老区振兴新图景
本报讯 (全媒体记者李思成) 9月的赣南大地,秋意正浓。近日,记者随“高质量发展中国行·焕新江西”专题活动采访团一行走进赣州市于都县
2025-09-22 07:15:00
近日从太钢获悉,太钢供应用于国家能源局首台(套)重大技术装备项目——扎拉水电站的900兆帕超高强磁轭钢顺利通过叠检试验
2025-09-22 07:26:00
南京微短剧有流量更有“料”
微短剧《平凡警事》海报。微短剧《金箔奇缘》海报。百川短剧剧组在拍摄现场。 中国(南京)游戏谷。□芮天舒韶静王懿闫葛菲地铁里
2025-09-22 07:40:00
为什么越来越多的女生,恋爱前要交换体检报告?
“亲亲许可证”在即将接上吻的那一刻,女友的脑袋往后一躲,闪开了。紧接着,她抬起头,认真地盯着老王,问他,“你有没有幽门螺旋杆菌
2025-09-22 00:56:00
河北日报讯(见习记者康晓博)AI工业内窥镜、无针注射笔、分布式储能路灯、风滚草仿生播种机器人……9月20日,2025河北国际工业设计周活动开幕
2025-09-21 08:12:00
厦门网讯(厦门日报记者 林钦圣 通讯员 江安娜 徐燕) 最近,不少厦门市民都注意到这样一个现象:上班高峰期,正当大家为等候BRT快速公交车而焦急时
2025-09-21 09:00:00
乐陵杨安镇香辛料数智化交易平台正式启动
9月20日,乐陵市杨安镇以“智链未来・香聚全球”为主题的香辛料数智化交易平台启动仪式暨黄河商品交易市场香辛料品种上线仪式隆重举行
2025-09-21 09:25:00
现场签约金额达115亿元!中国制造业民营企业合作交流对接会聚焦“AI+”
大皖新闻讯 9月20日,2025世界制造业大会中国制造业民营企业合作交流对接会在合肥举行。活动现场签约项目10个,总额115
2025-09-21 10:14:00
留交会上首次设立“新招引企业专区”,200多个岗位虚席以待——这里有一份令人“新”动的邀约□南京日报/紫金山新闻记者张甜甜在9月20日举行的留交会现场
2025-09-21 10:24:00
“+”上去,活下来——2025世界制造业大会采访引发的思考
大河网讯 9月20日,2025世界制造业大会在安徽合肥开幕。河南省作为主宾省参会,30家企业参展。在人们的印象中,河南农业可圈可点
2025-09-21 14:48:00
十堰成功举办2025新能源汽车零部件交易会项目路演 十大前沿技术项目集中亮相
十堰广电讯(全媒体记者 耿吉国 通讯员 刘爱理)9月21日上午,2025新能源汽车零部件交易会项目路演活动在十堰国际会展中心成功举办
2025-09-21 15:32:00
河北新闻网讯(王丽英)近日,宁晋县晶龙餐饮管理总公司凭借市场化转型与外向型发展战略的深入实施,成功签约宁晋县产融区学生食堂
2025-09-21 15:53:00
中新经纬9月20日电 题:L2新国标将给智能驾驶立“铁律”作者 江瀚 盘古智库高级研究员智能网联汽车组合驾驶辅助系统或将迎来国家标准
2025-09-21 19:36:00