• 我的订阅
  • 科技

麻省理工学院联合metaai开发streamingllm框架

类别:科技 发布时间:2023-10-07 00:12:00 来源:浅语科技

10月6日消息,麻省理工学院联合MetaAI的研究人员日前开发了一款名为StreamingLLM的框架,为大语言模型可能遇到的RAM与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。

麻省理工学院联合metaai开发streamingllm框架

▲图源GitHub

StreamingLLM的研究重点,是想解决实现流式语言模型(EfficientStreamingLanguageModels,ESLM)的障碍,特别是“长时间互动的多轮对话场景”中可能出现的问题。

研究人员指出,这种流式语言模型主要存在两大挑战:

第一个挑战:在解码阶段,获取token的键(Key)值(Value)状态会消耗大量的RAM。第二个挑战:目前流行的大语言模型,难以泛化适用“超过训练序列长度”的长文本。

IT之家注意到,过去有许多研究试图解决上述挑战,像是“扩展注意力窗口”,让语言模型能够处理超出预训练序列长度的长文本;或是建立一个固定大小的活动窗口,只关注最近token的键值状态,确保RAM使用率和解码速度保持稳定,但若遇到“序列长度超过缓存大小”时,这个策略就会失效。

而当前流式语言模型最大的挑战是“如何不消耗过多RAM且不损害模型性能的前提下,处理长文本输入”。

StreamingLLM对此采取的策略是“运用注意力下沉现象”,研究人员观察到,在自回归语言模型中,无论特定token和语言模型本身的相关性如何,如果对代token分配了大量的注意力。这些获得高度注意力的token,就会表现出注意力下沉的现象,即便这些token在语义上不重要,但他们仍然获得模型强烈关注(即给予特定token内容大量注意力,从而获得模型大部分的关注,而这些特定token内容包含“下沉token的键值”,从而确保无论输入序列有多长,模型的注意力计算都能维持稳定)。

麻省理工学院联合metaai开发streamingllm框架

▲图源GitHub

StreamingLLM的重要贡献,在于其提出一个简单且高效的解决方案,使语言模型不需微调就可以处理无限长度的文本。从而解决当前语言模型在流式应用的困境。虽然未来流式语言模型势在必行,但由于RAM效率的限制,以及模型在处理长序列的性能问题,相关模型发展仍受到挑战。

经研究团队证实,StreamingLLM能够让Llama2、MPT、Falcon和Pythia可靠地处理高达400万token的文本,能够为流式语言模型提供更多部署方面的可能性。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-07 09:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍
...研究中详细介绍了他们的发现。该研究的共同主要作者、麻省理工学院电子工程和计算机科学博士生尹天伟(音译)在一份声明中说
2024-03-27 13:42:00
研究人员开发了设计量子传感器的通用框架
...)。DOI:10.22331/q-2024-07-30-1427来自北卡罗来纳州立大学和麻省理工学院的研究人员设计了一种利用量子传感器能力的协议
2024-08-06 09:42:00
当麻省理工脑机接口接入波士顿动力Spot后 会碰撞出怎样的火花?
近日麻省理工学院,由Nataliya Kos'myna教授领导的研究团队发表了一篇Ddog项目的论文,该论文的研究方向是通过脑机接口与波士顿动力Spot四足机器人产生关联
2024-01-08 11:51:00
麻省理工学院为收入低于20万美元的家庭提供部分或全额学费
麻省理工学院扩大了其经济援助计划,允许年收入低于 20 万美元的符合条件的本科生免学费入学,这标志着在目前 14 万美元的限额基础上又有了大幅提高。 这一新的限额涵盖了约 80%
2024-11-23 09:55:00
麻省理工学院确认:该校一中国博士生突然身亡,导师:他是位了不起的化学家
据媒体报道,美国麻省理工学院的化学系博士生辛天斯(音译)于当地时间11月15日突然离世,这一消息给学术界“带来了沉重的打击”。据一名自称是辛天斯同学的网友透露,原计划在当天下午出
2023-11-21 16:27:00
麻省理工学院的3D纳米级晶体管利用量子隧道设计绕过物理限制
...一些限制。 物理定律对性能和能效造成了瓶颈。 现在,麻省理工学院的一组工程师可能已经找到了一种方法,利用一种激进的新型晶体管设计,以狂野的量子方式突破这些限制。他们要解决的问
2024-11-07 09:58:00
麻省理工学院利用ai设计蛋白质结构助力医疗发展
麻省理工学院的研究人员开发了一种名为FrameDiff的AI工具,使用生成式人工智能设计新的蛋白质结构,目的是加速药物开发和改进基因治疗。据悉,新型蛋白质结构的设计仍然是蛋白质工
2023-07-14 22:04:00
麻省理工学院开发“PhotoGuard”技术
...,人们愈发难以仅凭肉眼分辨“哪些内容是AI伪造的”,麻省理工学院日前宣布了一项名为Photoguard的技术,经过Photoguard技术处理的图片难以直接被AI识别篡改
2023-07-25 15:30:00
据美国方面16日消息,麻省理工学院的一名教授15日晚在波士顿附近的家中遭枪击身亡,警方已展开调查。据披露,47岁的物理学家努诺·洛雷罗15日晚在马萨诸塞州布鲁克莱恩的家中遭到枪击
2025-12-17 11:31:00
更多关于科技的资讯:
海信发布璀璨大冻梨冰箱 以“真大冷冻”新标准破解行业用户痛点
鲁网2月2日讯1月31日,海信正式推出全新产品——海信璀璨大冻梨冰箱。这款被定义为“行业大冷冻冰箱开创者”的产品,旨在系统性解决中国家庭在食材冷冻存储中长期面临的容积不足
2026-02-02 14:17:00
深挖用户痛点:海信璀璨大冻梨冰箱背后的“冻力”革命与创新哲学
鲁网2月2日讯中国家庭的冷冻室正面临一场普遍的“存储危机”:食材堆积导致存取不便;大量囤货时中心温度难以下降;化冻后的肉类口感干柴
2026-02-02 14:18:00
产业一线|每天翻开200次,折叠屏手机能用多久?
中新经纬1月29日电 (李自曼)“目前柔性OLED(有机发光二极管,是一种显示技术,被誉为第三代显示技术)屏,已经可以广泛应用在内折
2026-02-02 14:41:00
日前,在2026年美国气象学会年会上,英伟达正式推出Earth-2开放模型系列——面向人工智能气象领域的全开放、加速型模型与工具套件
2026-02-02 14:52:00
2026年1月30日,全球服务机器人行业领导者科沃斯(603486.SH)发布了2025年度业绩预告。预计2025年净利润17—18亿元
2026-02-02 14:53:00
AI赋能精准破局,绵阳开启高校毕业生高质量就业新路径
“以前写简历总抓不住重点,面试应答也缺乏逻辑。参加集训营后,我用AI工具精准生成了针对性简历和面试话术,还制作了个性化职业照和个人介绍短片
2026-02-02 14:54:00
没有什么比开业更优惠!三联家电章丘世茂店盛大试营业,全场5折起!
鲁网2月2日讯没有什么比开业更优惠!正值年货节消费旺季,三联家电作为国补以旧换新指定参与卖场,对个人消费者购买1级能效或水效标准的冰箱
2026-02-02 15:27:00
近日,多家媒体报道的“凌晨点外卖次数过多银行卡被风控”事件,让银行客户权益、风控安全之间的平衡问题再次受到关注。不少网友分享了类似经历
2026-02-02 16:27:00
AI OPC专区产业服务平台正式上线,助力无锡打造AI创新高地
近日,“智序·新征程—AI起航·预见未来”无锡市人工智能行业协会年度生态大会在无锡国际会议中心隆重举行。大会汇聚政府领导
2026-02-02 15:58:00
多彩贵州网讯 今年以来,都匀市税务局依托黔南州云税匀办税费集约中心持续拓展“线上主动服务”的应用场景,不断推动税费服务从“解答问题”向“解决问题”深刻转变
2026-02-02 16:10:00
零中断、零感知切换——泰安联通肥城分公司高效完成远端机房撤并实现降本增效与网络升级双突破
鲁网2月2日讯近日,在肥城城区的两个角落——交通局沿街6楼机房与上海世纪城基站,泰安联通肥城分公司组织网络综合支撑网格的10名技术骨干
2026-02-02 11:23:00
邮储银行精准滴灌 临沂商城春潮涌动
鲁网2月2日讯 (记者 吴艳萍 通讯员 李洁)新春将至,年味渐浓,作为全国规模最大的市场集群之一,临沂小商品城处处涌动着蓬勃生机与繁忙气息
2026-02-02 11:23:00
千问APP投入30亿 启动春节请客计划
2月2日,千问APP宣布投入30亿启动“春节请客计划”,以免单形式请全国人民在春节期间吃喝玩乐,感受AI时代的全新生活方式
2026-02-02 11:44:00
机器人的下一站:新华社记者张扬对话王兴兴
王兴兴称通用机器人一定可以实现“通用型机器人在我们这代人身上是能实现的,快点的话,十年间就是翻天覆地的变化。”在宇树科技创始人王兴兴看来
2026-02-02 12:56:00
集装箱卡车“混行”井然有序 厦门港海润码头上线水平运输智能调度系统
操作人员通过屏幕实时查看设备调度情况。(通讯员 林鸿涛 摄)厦门网讯(厦门日报记者 林桂桢)1月29日,走进厦门港海润码头的中控指挥台
2026-02-02 08:29:00