小钢炮,显微镜,大脑,模型,编码器,特征头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

【新智元导读】谷歌DeepMind的小模型核弹来了，Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B！而同时发布的Gemma Scope，如显微镜一般打破LLM黑箱，让我们看清Gemma 2是如何决策的。谷歌DeepMind的小模型，又上新了！就...……更多

2024-08-02 09:55:00小钢炮,显微镜,大脑,模型,编码器,特征

机器读脑时代向人类走来

...然图像是一个重要的里程碑。QST研究人员称，人类已使用显微镜和其他设备来观察肉眼看不见的世界，但还无法看到一个人的内心世界，这是人类第一次窥视另一个人头脑中的思想。从本质上讲，它可用来帮助创建新的通信设备...……更多

2024-01-10 02:47:00机器,人类,时代,大脑,解码器,研究

世界上第一项针对人工智能“大脑”的研究，剖析并编辑它的思想

...人员使用一种名为“字典学习”的技术，通过“稀疏自动编码器”，开始尝试将“神经元激活”的模式与人类熟悉的概念和想法相匹配。去年年底，他们在极小的“玩具”版本的语言模型上取得了一些成功，发现了模型在处理DNA...……更多

2024-06-19 09:21:00人工智能,剖析,人工,大脑,思想,智能

AI自己长出了类似大脑的脑叶？新研究揭示LLM特征的惊人几何

...解大型语言模型如何工作方面取得了突破性进展：稀疏自编码器（SAE）在其激活空间中发现了大量可解释为概念的点（「特征」）。最近，此类 SAE 点云已公开发布，因此研究其在不同尺度上的结构正当其时。最近，来自 MIT 的...……更多

2024-11-04 09:52:00长出,几何,大脑,特征,结构,研究

稀疏自编码器是如何工作的，这里有一份直观说明

...阵 → ReLU 激活 → 矩阵在解释机器学习模型方面，稀疏自编码器（SAE）是一种越来越常用的工具（虽然 SAE 在 1997 年左右就已经问世了）。机器学习模型和 LLM 正变得越来越强大、越来越有用，但它们仍旧是黑箱，我们并不理解...……更多

2024-08-06 09:27:00编码器,直观,编码,工作,向量,编码器

“环境显微镜”守护蓝天白云

...精细化覆盖。最内层“1公里×1公里”的网格犹如“环境显微镜”，能够敏锐捕捉街道级别的污染变化特征。为了让模型更加“聪明”，不需人工干预，就可以定时定点智能计算，在前期系统的开发上，创蓝科技针对南京的地形...……更多

2025-08-19 07:40:00白云,显微镜,蓝天,环境,南京,预报

扩散模型训练方法一直错了！谢赛宁：Representatio

...究表示了认可：「我们知道，当使用自监督学习训练视觉编码器时，使用具有重构损失的解码器的效果远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明，即使你只对生成像...……更多

2024-10-15 09:57:00模型,训练,方法,模型,训练,视觉

我国科学家发现哺乳动物“计时”奥秘

...任程和平院士介绍，团队通过自主研发的双侧扫描双光子显微镜，首次实现SCN区域近万颗神经元跨昼夜的钙成像。研究发现，SCN中以钙脉冲为基本单元，可形成从秒到小时到近日周期的跨尺度钙信号，展示出潜在的时间编码能力...……更多

2024-04-17 19:12:00哺乳,奥秘,科学家,动物,我国,科学

谢赛宁新作：表征学习有多重要？一个操作刷新SOTA，DiT训

...纽约大学的Yann LeCun的转发。当使用自监督学习训练视觉编码器时，我们知道一个事实，使用具有重建损失（reconstruction loss）的解码器的效果远远不如具有特征预测损失（feature prediction loss）和崩溃预防机制的联合嵌入架构。这...……更多

2024-10-23 09:55:00新作,速度,训练,学习,模型,训练

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...过程。语义遵从：业界首个以多模态大语言模型为文本编码器的视频生成模型，天然具备超高语义理解能力，在处理多主体及属性绑定等生成领域的难点挑战时表现出色。原生镜头转换：多视角镜头切换主体保持能力，艺术...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

零样本即可时空预测！港大、华南理工等发布时空大模型Urban

...GPT是一种创新的时空大型语言模型，它通过结合时空依赖编码器和指令微调技术，展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖，即使在数据稀缺的情况下也能提供准确的...……更多

2024-08-01 09:40:00时空,华南,样本,理工,模型,时空

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...预训练的视觉表征重要吗？该团队使用不同的预训练通用编码器作为世界模型的观察模型，并评估了它们的下游规划性能。在涉及简单动态和控制的 PointMaze 任务中，该团队观察到具有不同观察编码器的世界模型都实现了近乎...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Tu

...够了解 Gemma 2 模型的决策过程。Gemma Scope 就像一台强大的显微镜，它使用稀疏自编码器 (SAE) 放大模型的内部工作原理，使其更易于解释。Gemma Scope 技术报告：https://storage.googleapis.com/gemma-scope/gemma-sc……更多

2024-08-02 09:43:00模型,参数,模型,性能,安全,研究

守护蓝天“显微镜”，预报细至1公里

300次实验磨一剑！南京空气质量预报添利器守护蓝天“显微镜”，预报细至1公里南报网讯（记者杜莹）守护蓝天白云的科技力量在南京再次升级。近日，由江苏省南京环境监测中心携手南京创蓝科技有限公司打造的“南京市空...……更多

2025-07-21 07:24:00显微镜,预报,蓝天,南京,预报,空气质量

轻量化模型架构catvton的优势在哪里

...著帮助的文本交叉注意力，同时也不需要任何额外的图像编码器来辅助生成。下表详细地比较了不同方法与CatVTON的模块数量、参数量、可训练参数量、显存占用、推理条件。在网络模块上，CatVTON只需要VAE+UNet，无需任何额外的...……更多

2024-08-01 08:52:00架构,模型,优势,模型,训练,模块

阿里开源版Sora上线即屠榜 4070就能跑免费商用

...。那么，Wan 2.1是如何实现又好又省的呢？创新3D变分自动编码器和主流的视频生成技术路线一样，Wan 2.1的主体采用了DiT（Diffusion Transformer）架构。Wan利用T5编码器对输入的多语言文本进行编码，并在每个Transformer块内加入交叉注...……更多

2025-02-26 20:05:00阿里,商用,模型,视频,编码,编码器

文生图参数量升至240亿！Playground v3发布：深

...长图形设计。与传统依赖于预训练语言模型如T5或CLIP文本编码器的文本到图像生成模型不同，PGv3完全集成了大型语言模型（LLMs），基于全新的深度融合（Deep-Fusion）架构，利用仅解码器（decoder-only）大型语言模型的知识，来进...……更多

2024-10-08 09:48:00文生,图形设计,深度,图形,人类,参数

150万条多语种音频数据！浙大清华发布语音伪造检测框架Saf

...离与重建的过程中实现语音特征解耦。如图3所示，包括编码器（Encoder）、多层残差向量量化器（Residual Vector Quantizers, RVQs）、解码器（Decoder）、鉴别器（Discriminator）四个核心部分。其中，RVQs主要包括级联的八层量化器，在第...……更多

2024-09-27 13:40:00多语,多语种,万条,清华,隐私保护,框架