• 我的订阅
  • 科技

麻省理工学院联合metaai开发streamingllm框架

类别:科技 发布时间:2023-10-07 00:12:00 来源:浅语科技

10月6日消息,麻省理工学院联合MetaAI的研究人员日前开发了一款名为StreamingLLM的框架,为大语言模型可能遇到的RAM与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。

麻省理工学院联合metaai开发streamingllm框架

▲图源GitHub

StreamingLLM的研究重点,是想解决实现流式语言模型(EfficientStreamingLanguageModels,ESLM)的障碍,特别是“长时间互动的多轮对话场景”中可能出现的问题。

研究人员指出,这种流式语言模型主要存在两大挑战:

第一个挑战:在解码阶段,获取token的键(Key)值(Value)状态会消耗大量的RAM。第二个挑战:目前流行的大语言模型,难以泛化适用“超过训练序列长度”的长文本。

IT之家注意到,过去有许多研究试图解决上述挑战,像是“扩展注意力窗口”,让语言模型能够处理超出预训练序列长度的长文本;或是建立一个固定大小的活动窗口,只关注最近token的键值状态,确保RAM使用率和解码速度保持稳定,但若遇到“序列长度超过缓存大小”时,这个策略就会失效。

而当前流式语言模型最大的挑战是“如何不消耗过多RAM且不损害模型性能的前提下,处理长文本输入”。

StreamingLLM对此采取的策略是“运用注意力下沉现象”,研究人员观察到,在自回归语言模型中,无论特定token和语言模型本身的相关性如何,如果对代token分配了大量的注意力。这些获得高度注意力的token,就会表现出注意力下沉的现象,即便这些token在语义上不重要,但他们仍然获得模型强烈关注(即给予特定token内容大量注意力,从而获得模型大部分的关注,而这些特定token内容包含“下沉token的键值”,从而确保无论输入序列有多长,模型的注意力计算都能维持稳定)。

麻省理工学院联合metaai开发streamingllm框架

▲图源GitHub

StreamingLLM的重要贡献,在于其提出一个简单且高效的解决方案,使语言模型不需微调就可以处理无限长度的文本。从而解决当前语言模型在流式应用的困境。虽然未来流式语言模型势在必行,但由于RAM效率的限制,以及模型在处理长序列的性能问题,相关模型发展仍受到挑战。

经研究团队证实,StreamingLLM能够让Llama2、MPT、Falcon和Pythia可靠地处理高达400万token的文本,能够为流式语言模型提供更多部署方面的可能性。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-07 09:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍
...研究中详细介绍了他们的发现。该研究的共同主要作者、麻省理工学院电子工程和计算机科学博士生尹天伟(音译)在一份声明中说
2024-03-27 13:42:00
当麻省理工脑机接口接入波士顿动力Spot后 会碰撞出怎样的火花?
近日麻省理工学院,由Nataliya Kos\'myna教授领导的研究团队发表了一篇Ddog项目的论文,该论文的研究方向是通过脑机接口与波士顿动力Spot四足机器人产生关联
2024-01-08 11:51:00
麻省理工学院确认:该校一中国博士生突然身亡,导师:他是位了不起的化学家
据媒体报道,美国麻省理工学院的化学系博士生辛天斯(音译)于当地时间11月15日突然离世,这一消息给学术界“带来了沉重的打击”。据一名自称是辛天斯同学的网友透露,原计划在当天下午出
2023-11-21 16:27:00
麻省理工学院利用ai设计蛋白质结构助力医疗发展
麻省理工学院的研究人员开发了一种名为FrameDiff的AI工具,使用生成式人工智能设计新的蛋白质结构,目的是加速药物开发和改进基因治疗。据悉,新型蛋白质结构的设计仍然是蛋白质工
2023-07-14 22:04:00
麻省理工学院开发“PhotoGuard”技术
...,人们愈发难以仅凭肉眼分辨“哪些内容是AI伪造的”,麻省理工学院日前宣布了一项名为Photoguard的技术,经过Photoguard技术处理的图片难以直接被AI识别篡改
2023-07-25 15:30:00
光子技术:计算领域的革命性变革
麻省理工学院校友创立的光明科技公司正在开创性地利用光进行数据处理和传输,以解决传统计算方法的局限性。(艺术家概念图。)来源:SciTechDaily.com由三位麻省理工学院校友
2024-03-18 10:48:00
麻省理工学院研发出多模态织物,能高效过滤声音
5月29日消息,来自麻省理工学院(MIT)的科研团队成功研发出一种多模态织物,能高效过滤声音,相关成果发表在《先进材料》(AdvancedMaterials)杂志上
2024-05-30 02:19:00
麻省理工学院与美国职业资格与人才发展中心联手打造工程技术领域
波士顿,2023年2月4日-麻省理工学院(MIT)与美国职业资格与人才发展中心(UVT)宣布建立战略合作伙伴关系,共同推进工程技术领域的职业教育与人才培养。该合作计划旨在将MIT
2023-08-10 18:08:00
麻省理工一中国博士生突然身亡 校方拒绝透露死因 目击者:化学实验爆炸重伤不治 妻子:希望他的研究能继续下去
当地时间11月15日,美国麻省理工学院的化学系博士生辛天斯(音译)在学校突然离世。据同学透露,他原计划在当天下午出席学术论坛并现场作学术报告,但并没有出现。有目击者称,辛天斯在做
2023-11-23 16:28:00
更多关于科技的资讯: