• 我的订阅
  • 科技

麻省理工学院联合metaai开发streamingllm框架

类别:科技 发布时间:2023-10-07 00:12:00 来源:浅语科技

10月6日消息,麻省理工学院联合MetaAI的研究人员日前开发了一款名为StreamingLLM的框架,为大语言模型可能遇到的RAM与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。

麻省理工学院联合metaai开发streamingllm框架

▲图源GitHub

StreamingLLM的研究重点,是想解决实现流式语言模型(EfficientStreamingLanguageModels,ESLM)的障碍,特别是“长时间互动的多轮对话场景”中可能出现的问题。

研究人员指出,这种流式语言模型主要存在两大挑战:

第一个挑战:在解码阶段,获取token的键(Key)值(Value)状态会消耗大量的RAM。第二个挑战:目前流行的大语言模型,难以泛化适用“超过训练序列长度”的长文本。

IT之家注意到,过去有许多研究试图解决上述挑战,像是“扩展注意力窗口”,让语言模型能够处理超出预训练序列长度的长文本;或是建立一个固定大小的活动窗口,只关注最近token的键值状态,确保RAM使用率和解码速度保持稳定,但若遇到“序列长度超过缓存大小”时,这个策略就会失效。

而当前流式语言模型最大的挑战是“如何不消耗过多RAM且不损害模型性能的前提下,处理长文本输入”。

StreamingLLM对此采取的策略是“运用注意力下沉现象”,研究人员观察到,在自回归语言模型中,无论特定token和语言模型本身的相关性如何,如果对代token分配了大量的注意力。这些获得高度注意力的token,就会表现出注意力下沉的现象,即便这些token在语义上不重要,但他们仍然获得模型强烈关注(即给予特定token内容大量注意力,从而获得模型大部分的关注,而这些特定token内容包含“下沉token的键值”,从而确保无论输入序列有多长,模型的注意力计算都能维持稳定)。

麻省理工学院联合metaai开发streamingllm框架

▲图源GitHub

StreamingLLM的重要贡献,在于其提出一个简单且高效的解决方案,使语言模型不需微调就可以处理无限长度的文本。从而解决当前语言模型在流式应用的困境。虽然未来流式语言模型势在必行,但由于RAM效率的限制,以及模型在处理长序列的性能问题,相关模型发展仍受到挑战。

经研究团队证实,StreamingLLM能够让Llama2、MPT、Falcon和Pythia可靠地处理高达400万token的文本,能够为流式语言模型提供更多部署方面的可能性。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-07 09:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍
...研究中详细介绍了他们的发现。该研究的共同主要作者、麻省理工学院电子工程和计算机科学博士生尹天伟(音译)在一份声明中说
2024-03-27 13:42:00
研究人员开发了设计量子传感器的通用框架
...)。DOI:10.22331/q-2024-07-30-1427来自北卡罗来纳州立大学和麻省理工学院的研究人员设计了一种利用量子传感器能力的协议
2024-08-06 09:42:00
当麻省理工脑机接口接入波士顿动力Spot后 会碰撞出怎样的火花?
近日麻省理工学院,由Nataliya Kos'myna教授领导的研究团队发表了一篇Ddog项目的论文,该论文的研究方向是通过脑机接口与波士顿动力Spot四足机器人产生关联
2024-01-08 11:51:00
麻省理工学院为收入低于20万美元的家庭提供部分或全额学费
麻省理工学院扩大了其经济援助计划,允许年收入低于 20 万美元的符合条件的本科生免学费入学,这标志着在目前 14 万美元的限额基础上又有了大幅提高。 这一新的限额涵盖了约 80%
2024-11-23 09:55:00
麻省理工学院确认:该校一中国博士生突然身亡,导师:他是位了不起的化学家
据媒体报道,美国麻省理工学院的化学系博士生辛天斯(音译)于当地时间11月15日突然离世,这一消息给学术界“带来了沉重的打击”。据一名自称是辛天斯同学的网友透露,原计划在当天下午出
2023-11-21 16:27:00
麻省理工学院的3D纳米级晶体管利用量子隧道设计绕过物理限制
...一些限制。 物理定律对性能和能效造成了瓶颈。 现在,麻省理工学院的一组工程师可能已经找到了一种方法,利用一种激进的新型晶体管设计,以狂野的量子方式突破这些限制。他们要解决的问
2024-11-07 09:58:00
麻省理工学院利用ai设计蛋白质结构助力医疗发展
麻省理工学院的研究人员开发了一种名为FrameDiff的AI工具,使用生成式人工智能设计新的蛋白质结构,目的是加速药物开发和改进基因治疗。据悉,新型蛋白质结构的设计仍然是蛋白质工
2023-07-14 22:04:00
麻省理工学院开发“PhotoGuard”技术
...,人们愈发难以仅凭肉眼分辨“哪些内容是AI伪造的”,麻省理工学院日前宣布了一项名为Photoguard的技术,经过Photoguard技术处理的图片难以直接被AI识别篡改
2023-07-25 15:30:00
据美国方面16日消息,麻省理工学院的一名教授15日晚在波士顿附近的家中遭枪击身亡,警方已展开调查。据披露,47岁的物理学家努诺·洛雷罗15日晚在马萨诸塞州布鲁克莱恩的家中遭到枪击
2025-12-17 11:31:00
更多关于科技的资讯:
一颗播州辣椒的全球之旅
多彩贵州网讯 在黔北播州的绵延青山之间,一颗颗红彤彤的辣椒经过烘烤后,被集中送往位于石板镇国际辣椒产业园的遵义中椒生物科技有限公司
2026-01-29 17:49:00
科力装备携手华为云深化智能制造,打造汽车零部件行业数智化升级标杆
日前,工业和信息化部、教育部、市场监管总局、国家数据局四部门联合印发《汽车行业数字化转型实施方案》(以下简称《实施方案》)
2026-01-29 18:25:00
随着AI(人工智能)技术飞速发展,一种被称为OPC(One Person Company,一人公司)的新型创业形态正在兴起
2026-01-29 18:59:00
“咪咕阅读”正式升级为“咪咕悦看”,以文剧融合新生态践行数字文化发展使命
从追求流量到追求质量,微短剧行业正迈向精品化与主流化的升级之路,拥有大量好内容的网络文学是微短剧发展的重要推动力。咪咕阅读率先以“文剧融合”为抓手
2026-01-29 14:24:00
星聚会KTV中国香港双店同开
2026年1月27日,星聚会KTV(以下简称星聚会)正式官宣,中国香港铜锣湾V Point店与兰桂坊加州大厦店双店同步盛大启幕
2026-01-29 14:34:00
星巴克中国发布一季度财报 营收连续五个季度增长
1月28日晚,星巴克发布2026财年第一季度业绩报告,营收实现双位数增长,同店销售额连续三个季度正增长。营收连续五个季度增长
2026-01-29 15:24:00
五大优化精准惠民,2026年郯城县以旧换新再发力
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:44:00
惠民2800余万元!郯城县以旧换新释放消费新动能
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:46:00
注意力差、上课走神、做事拖拉磨蹭?这可能是学习能力需要“专业锻炼”的信号
鲁网1月29日讯学习困难是儿童成长过程中常见的问题,严重影响孩子的学业成绩和心理健康。因此,建立科学的筛查和干预机制,对于早期发现和解决学习困难问题至关重要
2026-01-29 15:35:00
科学探秘 巧手求真 观湖社区伯努利实验点亮青少年科学梦
“原来流动的空气真的有力量!”“乒乓球居然能悬浮在空中不掉下来!”近日,苏州工业园区唯亭街道观湖社区阿里博士实验室内欢呼声此起彼伏
2026-01-29 11:28:00
大皖新闻讯 1月28日晚间,星巴克发布2026财年第一季度业绩报告,中国市场延续强劲增长势头,营收实现双位数增长,同店销售额连续三个季度正增长
2026-01-29 12:51:00
京东携机器人亮相乡村舞台 光明村首届“村晚”科技感拉满
当智能机器人遇上“村晚”,科技与年味会碰撞出怎样的精彩?1月28日,江苏宿迁来龙镇光明村热闹非凡,由京东打造的首届“村晚”正式上演
2026-01-29 13:13:00
“溪山模式+溪有物种实践”赋能科创:从商业航天到核聚变
2026年1月22日,NSE2026第四届新物种进化大会暨2026溪山天使年会在北京大北农凤凰国际创新园隆重举行。这场由溪山天使汇
2026-01-29 13:14:00
爱喏与宅智造达成战略合作:融合产品体系与服务网络,打造高效家装新平台
近日,融合产品设计与实用美学的健康水生态品牌“爱喏”与国内领先的一站式建材服务商“宅智造”建材超市正式签署战略合作协议
2026-01-29 13:16:00
第五届青山科技奖出炉:聚焦“数字+绿色”,鼓励基础科研“更落地”
1月29日,第五届青山科技奖获奖名单正式揭晓,10位绿色低碳领域的青年科学家入选。获奖名单中首次出现两名“95后”科学家
2026-01-29 13:33:00