• 我的订阅
  • 头条热搜
Sigmoid注意力一样强,苹果开始重新审视注意力机制
机器之心报道机器之心编辑部注意力是 Transformer 架构的关键部分,负责将每个序列元素转换为值的加权和。将查询与所有键进行点积,然后通过 softmax 函数归一化,会得到每个键对应的注意力权重。尽管 SoftmaxAttn 中的 softmax 具...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...因为当前最佳的基于 Transformer 的 LLM 既深又宽,并且计算注意力的成本会随 prompt 中 token 数量而呈二次增长。举个例子,Llama 2(7B 版本)堆叠了 32 层 Transformer,模型维度为 4096。在这种情况下,TTFT 需要的 walltime 是……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
Transformer 在深度学习领域取得巨大成功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分,实现了更好的上下文理解。然而,注意力机制的缺点是计算开销大,会随输入规模而二次增长,Transfo...……更多
中国科研团队研发出低功耗类脑神经形态系统级芯片
...计算系统成为极具潜力的方向。本次研究基于的人脑中的注意力机制示意图。中国科学院自动化研究所/供图在本项研究中,合作团队提出“神经形态动态计算”的概念,通过设计一种类脑神经形态芯片Speck来实现基于注意力机制...……更多
infini-attention:谷歌大内存机制
...最新SOTA。这就是谷歌最新提出的 Infini-attention机制(无限注意力)。它能让Transformer架构大模型在有限的计算资源里处理无限长的输入,在内存大小上实现 114倍压缩比。什么概念?就是在内存大小不变的情况下,放进去114倍多的...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...调多种条件和训练方案生成多角度的逼真图像。它引入了注意力机制,通过修改自注意力层的关键(K)和值(V)矩阵,接受额外的条件图像,提高了生成图像的准确性。此外,Zero123++引入了一个可训练的线性引导机制(来自Flex...……更多
血压偏高的人,平时需要注意饮食,多吃5种“降压”食物
...这可能是一个不好的征兆暗示高血压恶化的一个信号。6.注意力不集中高血压初期此症状不明显,但是随着病情发展,中度或者重度高血压人群容易注意力分散,很难记住近期发生的事,却对陈年旧事记忆犹新。血压长期偏高,...……更多
超低功耗类脑芯片问世,中国团队研发出毫瓦级Speck系统
...通过设计一种类脑神经形态系统 Speck 来实现基于大脑“注意力”机制的动态计算。首先,在硬件层面,实现了“没有事件输入就不消耗能量”;其次,在算法层面,实现了“有事件输入时能够根据输入重要性程度来动态调整计...……更多
一激动就脸红的人 一定要小心这种病!
...,尽量地远离可能让你感到脸红的情境。还可以通过转移注意力的方式来减少脸红,通过日常记录自己脸红的事件,在安全的环境下锻炼注意力,刻意地将注意力转移到具体的事务上,减少对自身的关注。如果脸红已经引发了明...……更多
桌子乱还是整齐  各有各的好
...整齐是一件好事,毕竟,过于杂乱的桌子会不断分散人的注意力,降低人的工作效率。同理,杂乱无章的电脑桌面,混乱的文件夹也让人找不到东西。2012年的一项调查就发现,每一周打工人都要在自己电脑里找各种数据文档,...……更多
打电话时,给他啥都会收下?真的吗 ?
...绝呢?今天,我们就一起走进心理学的世界,寻找一下与注意力相关的问题的答案。注意可分为外源性注意和内源性注意跳出打电话接东西这个语境,我们的所有行为、决策都离不开注意,那什么是注意?注意是一个医学或心理...……更多
我国科学家研发出低功耗类脑芯片
...重要功能是根据外界刺激的重要程度,动态分配其有限的注意力资源,重要的刺激往往会获得更多的关注,这被称为注意力机制。该研究提出了“神经形态动态计算”的概念,将人脑中的高抽象层次注意力机制应用于类脑芯片设...……更多
苹果和它一起煮,是天然“刮油冠军”,常吃小肚子没了,整个畅通
...良好的睡眠可以帮助身体恢复能量,增强免疫力,并提高注意力和专注力。我们应该保持规律的睡眠时间,避免熬夜和频繁使用手机等电子设备影响睡眠质量。改善饮食习惯是保持身体健康的重要环节。通过注重食物的荤素搭配...……更多
哈佛大学:多吃含类黄酮的食物,或能保护孩子大脑
...研究。杂志中提到,富含类黄酮的食物可以帮助孩子改善注意力和记忆力。小丽的妈妈决定尝试给小丽增加富含类黄酮的食物摄入。她开始在小丽的早餐中加入蓝莓和草莓,午餐时搭配橙汁,晚餐则选择富含类黄酮的蔬菜如菠菜...……更多
为什么有人能在乱哄哄的自习课写作业?因为大脑自动降噪了
...感官同时接收着大量信息,我们依然能通过某种方式集中注意力,做好重要的事。注意过程是大脑对相关刺激打上探照灯,并过滤其他内容的方式。为了确定瞄准和驱动这一探照灯的神经回路,过去数十年来,研究主要集中在大...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...识库(或任何文本数据集)转换为显式记忆,实现为稀疏注意力键 - 值,然后在推理过程中调用这些内存并将其集成到自注意力层中。新的记忆格式定义了新的记忆层次结构:此外,本文还介绍了一种支持知识外化的记忆电路理...……更多
国内的安卓和国外的安卓有什么区别?
...畅度上就有很大的区别。国外的原生安卓为了不分散用户注意力,尽可能的采用干净清爽的设计,简约的第一印象从开机那—刻就得以体现。而国内疏于管理,同一厂家软件相互后台唤醒,全家桶之类的,开发者为了实现目的不择手...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...自动驾驶模型的可解释性,该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图像的权重,从而使自动驾驶车辆能够像经验丰富的人类驾驶员一样,具备有效...……更多
学生心理弹性对健康的影响有哪些?
...试观看不同情绪效价面孔时的注意特征发现,高弹性者的注意力很快地被正性面孔吸引,然后会将注意力从负性面孔上转移去注意中性面孔。他们对正性信息的优先注意和对负性信息的回避注意似乎就起着正向的调节作用,他们...……更多
3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA
...型编辑和嵌入推导。首先,RECE以解析解的形式,在交叉注意力层中将风险概念映射到无害概念。然后,RECE以解析解的形式推导出风险概念的新嵌入表示并用于下一轮的模型编辑。RECE还包括了一个简洁有效的正则项,可以证明其...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...该技术名为 Pyramid Attention Broadcast (PAB)。通过减少冗余注意力计算,PAB 实现了高达 21.6 FPS 的帧率和 10.6 倍的加速,同时不会牺牲包括 Open-Sora、Open-Sora-Plan 和 Latte 在内的流行基于 DiT 的视频生成模型……更多
早餐可不是吃了就行,这几个搭配误区一定要注意
...,一个营养均衡的早餐能够提高大脑功能,增强记忆力和注意力。例如,一项针对学生的研究发现,那些有规律吃早餐的学生在学校的表现往往更好,这是因为早餐提供了他们一天中学习所需的能量和营养。此外,健康的早餐还...……更多
美国医疗机构Sharp HealthCare采购30台Vision Pro开展医疗培训
...来、在房间里摔倒的病人的工作人员可以穿戴头显,并把注意力集中在需要进一步调查的视频上。埃克斯利指出:“你知道,麻醉师实时监控大量信息,生命体征、心电图、肺活量测定、波形。”所以其中一种想法是,将相关读...……更多
了解CEEX:揭秘其创新通缩策略下的MeMe平台币CMC
...正确”方式。在信息热点快速迭代的币圈,最有价值的是注意力。知名博主@redphonecrypto指出:“代币吸引注意力的能力比其他指标更重要,吸引注意力的能力越强,其潜在的上升空间就越大。”在这样的环境下,CEEX和其旗下的Me...……更多
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
...彻底改变了语言建模。Transformer 是一种神经网络,它使用注意力机制处理长期文本依赖关系。谷歌于 2017 年创建了第一个用于文本翻译的 Transformer 模型。Transformer 此后不断发展,改进了注意力机制和架构。发展到今天,OpenAI 发...……更多
企业金融化对企业创新的影响研究
...现,过度金融化可能分散企业资源,导致创新活动资金和注意力不足,抑制创新能力。实证分析验证了金融化与创新之间的负相关性。为促进企业创新,建议企业调整金融化策略,确保研发投资,优化风险管理,加强组织间沟通...……更多
马斯克脑机接口公司新进展!将脑机芯片植入第二位受试者脑内获允
...重要功能是根据外界刺激的重要程度,动态分配其有限的注意力资源,重要的刺激往往会获得更多的关注,这被称为注意力机制。该研究提出了“神经形态动态计算”的概念,将人脑中的高抽象层次注意力机制应用于类脑芯片设...……更多
怎么回事啊!最近满脑子都是《苹果香》
...放。而一些研究表明,工作记忆有困难的人,如那些患有注意力缺陷障碍(ADD)的人,就可能较少经历耳虫现象;而患有强迫症的人,如果他们的大脑中存在这些音乐循环,可能更容易发生“耳虫”现象。“耳虫”现象也可以用...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...的文本信息时可能会遇到困难。 本质上,Transformer 中的注意力机制通过将每个单词(或 token)与文本中的每个单词进行比较来理解上下文,它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩...……更多
考场的天花板高度会影响考试成绩?这可能是真的
...一个新研究发现,考场的天花板高度也可能影响到学生的注意力和发挥,从而影响最终的成绩。天花板的高度,真能影响考试成绩?南澳大学和迪肯大学的研究揭示了高天花板房间与较差考试成绩之间的联系。这项研究由具有建...……更多
更多关于科技的资讯:
高通:骁龙PC退货率并不高!符合行业标准
快科技12月15日消息,日前,Intel声称高通的骁龙PC退货率偏高,因为消费者对软件兼容性不佳并不满意,对此高通予以明确驳斥
2024-12-15 18:48:00
重大消息:AIX Wallet正式接入ChatGPT接口
亲爱的AIXWallet用户们,我们非常激动地宣布,AIXWallet现已成功接入ChatGPT接口,为您带来前所未有的智能服务体验
2024-12-15 19:13:00
破铺轨施工最快纪录!渝厦高铁重庆东至黔江段全线轨道贯通
快科技12月15日消息,据报道,在重庆市武隆区白马山隧道出口施工现场,随着建设者将最后一对500米长钢轨顺利铺设到接轨点
2024-12-15 19:18:00
又有新折叠!传音2款折叠在印度开售,最低人民币约3003元起
近期,传音在日本发布了2款新折叠手机,——PhantomVFold2和PhantomVFlip2,在亚马逊官网上最低售价仅为3003元人民币起
2024-12-15 19:28:00
魅族20系列手机迎来Flyme 11.2.0.0A稳定版更新
魅族20系列手机12月12日推送Flyme11.2.0.0A稳定版更新,这次更新覆盖了魅族20、魅族20Pro、魅族20INFINITY无界版等机型
2024-12-15 19:28:00
马斯克能否造一款“特斯拉手机”?特斯拉手机渲染图曝光
近日,有一个马斯克的恶搞账号在社交平台上发布了“特斯拉手机”的渲染图,并询问大家是否接受其作为圣诞节礼物。目前并没有确切的消息表明特斯拉会正式推出自己的智能手机
2024-12-15 19:29:00
石头科技助你放心躺平,洗地机A30支持躺平自带零感清洁
这年头家里要是没备上几样家务神器,那可以说是压根就不会主动提做家务。工作已经这么忙,留给自己的时间本就雪上加霜。要是有个在家里溜达一圈
2024-12-15 19:33:00
对标华为的“荣耀”!荣耀线上性能机GT官宣,赵明不惜成本打造
曾经的荣耀,就是华为性能手机的代表,用来与小米等品牌在线上抢夺手机市场!而随着荣耀的独立,开始自立门户,优先以线下市场为发力点
2024-12-15 19:33:00
谷歌Gemini 2.0发布,我看到了Web的未来
OpenAI的超长发布会还没结束,谷歌便火速推出Gemini2.0系列的第一个版本——Gemini2.0Flash测试版
2024-12-15 19:36:00
全力研发AI服务器:苹果搁浅M4 Extreme开发
苹果已经发布了M4系列处理器,在性能上比之前相比提升十分地明显,此外在AI性能上同样如此,不过目前的M4处理器并不能算是完全体
2024-12-15 19:36:00
海光新款16核心CPU首曝:多核性能还不如6核心Zen3
快科技12月15日消息,国产CPU处理器中,海光和兆芯都兼容x86指令集,其中海光基于第一代Zen架构,兆芯则是基于威盛IP
2024-12-15 19:48:00
塔克拉玛干沙漠惊现周长9米的巨型胡杨!为何如此强悍
据报道,12月11日,越野达人董长凯在穿越穿越塔克拉玛干沙漠时,在克里雅古道之中发现了一棵巨型胡杨树!经过测量,这颗树的胸围达到了9米
2024-12-15 19:48:00
规模世界第一!我国在运和核准在建核电机组装机约1.13亿千瓦
快科技12月15日消息,据报道,截至2024年,我国在运和核准在建核电机组装机约1.13亿千瓦,规模升至世界第一。2025年
2024-12-15 20:48:00
AOC新款34寸带鱼屏上市:180Hz VA面板首发1499元
快科技12月15日消息,AOC新款34寸带鱼屏——CU34G10XP目前已经上市,首发1499元。据悉,新款显示器配备34寸VA面板
2024-12-15 21:18:00
5.1GHz也没用!AMD史上最快四核心只能勉强喂饱RTX 4060
快科技12月15日消息,如今,四核心处理器已经基本离我们远去,不过AMD今年中面向中小企业发布的EPYC 4004系列
2024-12-15 21:48:00