• 我的订阅
  • 头条热搜
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
【新智元导读】谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。谷歌DeepMind的小模型,又上新了!就...……更多
...然图像是一个重要的里程碑。QST研究人员称,人类已使用显微镜和其他设备来观察肉眼看不见的世界,但还无法看到一个人的内心世界,这是人类第一次窥视另一个人头脑中的思想。从本质上讲,它可用来帮助创建新的通信设备...……更多
世界上第一项针对人工智能“大脑”的研究,剖析并编辑它的思想
...人员使用一种名为“字典学习”的技术,通过“稀疏自动编码器”,开始尝试将“神经元激活”的模式与人类熟悉的概念和想法相匹配。去年年底,他们在极小的“玩具”版本的语言模型上取得了一些成功,发现了模型在处理DNA...……更多
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
...解大型语言模型如何工作方面取得了突破性进展:稀疏自编码器(SAE)在其激活空间中发现了大量可解释为概念的点(「特征」)。最近,此类 SAE 点云已公开发布,因此研究其在不同尺度上的结构正当其时。最近,来自 MIT 的...……更多
稀疏自编码器是如何工作的,这里有一份直观说明
...阵 → ReLU 激活 → 矩阵在解释机器学习模型方面,稀疏自编码器(SAE)是一种越来越常用的工具(虽然 SAE 在 1997 年左右就已经问世了)。机器学习模型和 LLM 正变得越来越强大、越来越有用,但它们仍旧是黑箱,我们并不理解...……更多
扩散模型训练方法一直错了!谢赛宁:Representation matters
...究表示了认可:「我们知道,当使用自监督学习训练视觉编码器时,使用具有重构损失的解码器的效果远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明,即使你只对生成像...……更多
...任程和平院士介绍,团队通过自主研发的双侧扫描双光子显微镜,首次实现SCN区域近万颗神经元跨昼夜的钙成像。研究发现,SCN中以钙脉冲为基本单元,可形成从秒到小时到近日周期的跨尺度钙信号,展示出潜在的时间编码能力...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...纽约大学的Yann LeCun的转发。当使用自监督学习训练视觉编码器时,我们知道一个事实,使用具有重建损失(reconstruction loss)的解码器的效果远远不如具有特征预测损失(feature prediction loss)和崩溃预防机制的联合嵌入架构。 这...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...GPT是一种创新的时空大型语言模型,它通过结合时空依赖编码器和指令微调技术,展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖,即使在数据稀缺的情况下也能提供准确的...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
...够了解 Gemma 2 模型的决策过程。Gemma Scope 就像一台强大的显微镜,它使用稀疏自编码器 (SAE) 放大模型的内部工作原理,使其更易于解释。Gemma Scope 技术报告:https://storage.googleapis.com/gemma-scope/gemma-sc……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...预训练的视觉表征重要吗?该团队使用不同的预训练通用编码器作为世界模型的观察模型,并评估了它们的下游规划性能。 在涉及简单动态和控制的 PointMaze 任务中,该团队观察到具有不同观察编码器的世界模型都实现了近乎...……更多
轻量化模型架构catvton的优势在哪里
...著帮助的文本交叉注意力,同时也不需要任何额外的图像编码器来辅助生成。 下表详细地比较了不同方法与CatVTON的模块数量、参数量、可训练参数量、显存占用、推理条件。在网络模块上,CatVTON只需要VAE+UNet,无需任何额外的...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...长图形设计。与传统依赖于预训练语言模型如T5或CLIP文本编码器的文本到图像生成模型不同,PGv3完全集成了大型语言模型(LLMs),基于全新的深度融合(Deep-Fusion)架构,利用仅解码器(decoder-only)大型语言模型的知识,来进...……更多
150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024
...离与重建的过程中实现语音特征解耦。如图3所示,包括编码器(Encoder)、多层残差向量量化器(Residual Vector Quantizers, RVQs)、解码器(Decoder)、鉴别器(Discriminator)四个核心部分。其中,RVQs主要包括级联的八层量化器,在第...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...律性。 动态交通模式:除了周期性变化外,作者的时间编码器还捕捉交通数据随时间演变的复杂、非线性时态动态和趋势。周期性交通转换建模作者利用时间嵌入D和空间嵌入C捕获交通中的周期性模式,目标是揭示历史交通模式...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...型架构根据介绍,Ferret 主要由用于提取图像嵌入的图像编码器;用于提取区域连续特征的空间感知视觉采样器;以及用于对图像、文本和区域特征进行联合建模的大语言模型组成。输入将图像输入经过预训练的视觉编码器 CLIP-Vi...……更多
微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型,实现高质量的语义分割任务
...器进行微调。在语义分割中,可以将已经训练好的模型的编码器部分用于新任务,然后在新任务上训练新的解码器,并帮助利用已有的大规模标注数据集来训练模型,从而减少对新数据集的标注需求,提高模型性能。WIMI微美全...……更多
硅谷来信:诺奖“盖戳”认证,AI成科研“最强大脑”?
...算机视觉?研究人员形象地把深度计算机视觉比作\"数字显微镜\"。它不仅能\"看\"到人眼难以分辨的细节,更重要的是能自动学习和理解看到的内容。就像一个经验丰富的天文学家,AI系统能够:1. 自动特征学习: 不需要人工定义\"太...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...性(similarity)时,传统指标LPIPS等方法依靠预训练的图像编码器,将图像特征嵌入后再计算距离。然而,这类方法只能评估图像与图像之间的相似度(image-to-image metric),而无法判断文本和图像之间的相似度(text-to-image metric)...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...如图 2 所示):特征提取模块:该模块包含一系列单模态编码器,每个编码器都接受一段简短的单模态观测历史作为输入,并将它们编码为特征。 状态编码器:该模块旨在将各模态特征和动作历史序列编码为表示当前任务状态...……更多
英国ai初创公司wayve公布gaia-1最新进展
...汽车上路时的安全性和效率。据悉,GAIA-1会先运用专门的编码器,将影片或文字等各种形式的输入,编码成一个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...个表示空间中进行预测。两个嵌入将被破坏的版本X送入编码器,将Y送入编码器,然后训练系统从X的表示中预测Y的表示。那么如何做到这一点呢?如果单纯使用梯度下降和反向传播这样的方法来训练系统,以减少预测误差,那...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...及去噪效果方面均表现出色。研究方法基于图协同过滤的编码器受到简化图神经网络(GNN)成功应用的启发,图那对在社交去噪框架中采用了轻量级图卷积网络(GCN)作为图编码器。 图关系去噪模型隐空间的社交扩散汲取扩散...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
... Seamless Speech Interaction with Large Language ModelsLLaMA-Omni 由语音编码器、语音适配器、LLM 和流式语音解码器组成。用户的语音指令由语音编码器进行编码,经过语音适配器后输入到 LLM。LLM 直接从语音指令中解码文本响应,……更多
无需训练即可大幅提升SAM 2!SAM2Long来了,港中文 上海AI Lab出品
...器和内存模块的多次处理上。然而,这些模块相较于图像编码器来说非常轻量。例如,SAM 2-Large 的图像编码器包含 212M 个参数,而模型其余的参数只有 12M,大约仅占模型的 5%。因为 SAM2Long 也只需要处理一次图像编码器,所以内...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...间序列的大模型(Large Time Series Model, LTSM)。模型采用仅编码器(Decoder-only)结构,基于多领域时间序列进行大规模预训练,通过微调突破了少样本场景下的性能瓶颈,适配不同输入输出长度的时间序列,以及预测,填补,异常...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...一部分:音视频编码和时间对齐video- SALMONN使用Whisper语音编码器和BEATs音频编码器,分别得到语音和音频的编码向量序列(每1秒音频对应50个向量),同时使用InstructBLIP视觉编码器,以2 FPS的视频采样率得到视觉编码向量序列(...……更多
...智能柔性关节领域不断钻研,通过将电机、驱动器,以及编码器整合到一起,并不断优化电机与算法,配合机器人“大脑”,一步步拓展更丰富的功能和应用场景。智能柔性关节让服务机器人在各类场景里更加实用,而把它们的...……更多
【玖越机器人】堆叠降噪自动编码器(SDAE)
自动编码器(Auto-Encoder,AE)自编码器(autoencoder)是神经网络的一种,经过训练后能尝试将输入复制到输出。自编码器内部有一个隐藏层 h,可以产生编码(code)表示输入。该网络可以看作由两部分组成:一个由函数 h = f(x) 表...……更多
科学家揭示大脑神秘新机制:尝试解释海马体如何映射外部世界
...研究。比如,在攻读博士期间,周宁常常借助双光子荧光显微镜技术,对那些被荧光指示剂标记的脑片组织进行成像记录。她经常观察到活脑片细胞中的钙离子荧光强度随着脑细胞的活动变化而忽明忽暗,此起彼伏、如同遥远星...……更多
更多关于科技的资讯:
随着AI强劲增长,市场对算力的需求也持续提升,韶关正瞄准千亿级华南算力产业集群,打造世界级算力之城。2月14日,韶关市人民政府与广东东阳光科技控股股份有限公司在市区隆重举行战略合作框架协议签约仪式
2025-02-16 20:00:00
山西焦煤西山煤电西曲选煤厂2月16日公布了一组数字:该厂在煤泥处理方面取得了显著成效,2024年煤泥产出率同比由2.48%降低至1
2025-02-16 18:18:00
聚力建支点 夺取开门红丨十堰国科鸿鹄:加快农机研发 力争年产2000台
十堰广电讯(全媒体记者 叶旭升 郧阳区融媒记者 郝周)一季度是全年经济的风向标,抢开局、夺首胜关乎信心、关乎全局。新春伊始
2025-02-16 18:38:00
奋战开门红|亚非拉市场表现抢眼,蓝晶易碳光伏产品拓宽国际赛道
齐鲁晚报·齐鲁壹点 隋忠伟 厉昕月 李浩在非洲与东南亚的广袤大地上,电网基础设施建设相对滞后,停电断电频繁,当地民众对稳定电力的渴望极为迫切
2025-02-16 19:02:00
大国重器上新!国产自研载人飞艇AS700电动款来了:2月首飞
快科技2月16日消息,据媒体报道,国产AS700D电动款载人飞艇通过首飞放飞评审,预计本月底首飞。据介绍,AS700D是AS700载人飞艇的改进型
2025-02-16 12:23:00
微软Edge设置页面变样:更精简、打开更快
快科技2月16日消息,微软在Dev频道最新的134.0.3124.8版本中,对Edge的设置页面进行了重新设计。新版设置页面整体设计风格更加贴近谷歌Chrome浏览器
2025-02-16 12:23:00
洗脸熊携手IPTV平台,亮相央视春晚共庆阖家欢聚时刻
瑞蛇贺岁,欣欣向荣。2025年央视春晚,洗脸熊携手IPTV,重磅登陆2025年中央广播电视总台春节联欢晚会,与全国观众一同喜庆迎春
2025-02-16 12:58:00
跨越速运21机队+西部枢纽空侧联动,时效暴击碾压三流玩家
2月14日,跨越速运在西部航空枢纽空侧的启用仪式上迎来了历史性突破。同日,第21架全货机成功完成成都⇌无锡航线的首航任务
2025-02-16 13:02:00
你嫌弃的共享按摩椅,“躺”出了一个上市公司
带来身体放松的按摩或许是职场人的刚需,但共享按摩椅绝对不是。作者 | 黑莓编辑 | DR题图 | 视觉中国 任谁都没想到
2025-02-16 15:16:00
Intel面临拆分!博通、台积电都在考虑接手
快科技2月16日消息,据媒体报道,Intel的竞争对手博通和台积电,正在分别探索接手Intel部分业务的可能性。报道指出
2025-02-16 13:23:00
苏州工业园区提振消费促商贸高质量发展
2月13日,苏州工业园区举行提振消费暨商贸发展工作推进会,旨在探讨商贸业发展的新趋势、新机遇和新挑战,聚焦政策引导、消费提振策略
2025-02-16 13:49:00
商贸焕新升级在苏州工业园区“加速跑”
在苏州工业园区,多元化、品质化、个性化的各类商贸载体“加速跑”求新求变,展现区域商贸发展的缤纷百态。位居苏州工业园区金鸡湖西岸的苏州中心商场充分发挥苏州最大商业综合体的优势和能量
2025-02-16 13:50:00
苏州工业园区科技项目不断“更新”发展
近年来,苏州工业园区围绕创新药物、高端医疗器械、大健康等领域,持续加大支持力度,截至目前已集聚相关企业超2000家,产值规模突破1655亿元
2025-02-16 13:50:00
王炸级组合官宣!微信等腾讯旗下多个产品将接入DeepSeek:辐射14亿人
快科技2月16日消息,微信灰度测试接入DeepSeek之后,官方表示,腾讯旗下多个产品正探索接入。据央视消息,今日从腾讯集团了解到
2025-02-16 13:53:00
小女孩突然从路边窜出 问界M7 AEB紧急刹停救下一个家庭
快科技2月16日消息,近日,有问界M7车主发布了一段AEB实战救下一位小女孩的记录仪视频。视频中,这辆车在右侧车道正常行驶
2025-02-16 13:53:00