• 我的订阅
  • 汽车

度小满联合哈工大推出自适应剪枝算法 实现多模态大模型高效优化

类别:汽车 发布时间:2024-05-17 13:00:00 来源:前沿观注

多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法——SmartTrim。凭借精细化的剪枝策略,SmartTrim能够在保持模型性能的同时,大幅提升计算效率。

自适应剪枝能力,智能识别并剪除不必要的计算负担

在视觉语言大模型(VLM)的研究和应用中,高计算成本一直是制约其广泛部署的主要障碍。近日,哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——SmartTrim。该算法针对多模态大模型的冗余计算进行有效削减,实现了显著的效率提升,相关研究成果已被国际自然语言处理领域顶级会议COLING24接收。

据介绍,SmartTrim技术的核心在于其自适应剪枝能力,通过分析模型中每层的token表示和attentionhead的冗余性,智能识别并剪除不必要的计算负担。这一过程中,SmartTrim不仅考虑了token在单一模态序列中的重要性,还特别强调了跨模态交互中的关键作用。通过这种精细化的剪枝策略,SmartTrim能够在保持模型性能的同时,大幅提升计算效率。

在基于VQA微调的METER的跨模态编码器中,层内不同token(上)和attentionhead(下)表示的相似性。

SmartTrim框架的实施涉及两个关键组件:跨模态感知的Token修剪器和模态自适应的注意力头修剪器。Token修剪器利用多层感知器(MLP)结构,智能地识别并去除那些对于当前层不重要的Token。这一过程不仅考虑了Token在文本或图像序列中的独立重要性,还综合了它们在跨模态交互中的贡献。注意力头修剪器则直接集成在模型的自注意力模块中,评估并修剪那些冗余的注意力头,从而优化了模型的计算效率。

SmartTrim框架结构图

在训练SmartTrim模型时,研究人员采用了一种结合任务相关目标和计算开销目标的双重优化策略。通过重参数化技巧,解决了不可导二值mask的问题,实现了模型的端到端训练。此外,自蒸馏和课程学习策略的引入,进一步提高了剪枝后模型的性能,确保了训练过程的稳定性。

持续布局多模态大模型,为行业发展注入活力

实验结果表明,SmartTrim在METER和BLIP两个VLM上实现了2-3倍的加速,同时将性能损失最小化。这一成果不仅在理论上具有创新性,也为实际应用中的模型优化提供了新的思路。特别是在1.5倍加速比下,SmartTrim的性能甚至超过了原始模型。在高加速比下,SmartTrim相比其他方法展现出显著优势。SmartTrim技术的推出,标志着多模态大模型研究的一个重要里程碑。度小满表示,SmartTrim技术将在未来整合到公司的轩辕大模型中,以推动大模型技术的发展。

此次,度小满联合哈尔滨工业大学共同推出SmartTrim,借助创新技术进一步提升计算效率,不断创新金融智能服务,带给消费者优质便捷的服务体验。在未来,度小满将持续布局多模态大模型,在创新技术领域展开积极地探索与实践,不断攻克技术难题,以先进技术助力金融行业高质量发展。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-17 18:45:15

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有
2024-10-18 09:47:00
...1亿美金。资金主要将用于核心研发团队的建设,加速多模态大模型和应用产品的研发。成立于2023年3月,生数科技由安全可控人工智能方案提供商瑞莱智慧RealAI、蚂蚁集团和BV百
2023-06-19 09:03:00
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手
2024-07-25 09:31:00
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和
2024-03-14 15:12:00
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新
2023-03-15 13:30:00
全球首个全模态大模型紫东太初2.0发布,中科院王金桥:希望实现更类人的智能
...能框架的最新进展。会上,基于昇思AI框架的全球首个全模态大模型“紫东.太初2.0”正式发布,支持多轮问答、文本创作、图像生成、3D理解、信号分析等跨模态任务。“我们的初心就是
2023-06-18 15:00:00
Tech100 | 哈工大深圳团队入局多模态大模型,自研「若愚-九天」荣登OpenCompass榜首
...托学校的哈深资产经营有限公司进行成果转化,成立了多模态大模型研发企业--深圳若愚科技有限公司(以下简称“若愚科技”)。若愚科技旗下首款多模态大模型“若愚-九天”首次参评即登顶
2023-08-09 09:55:00
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上
2024-01-17 16:47:00
...型价值的唯一标准,旷视科技也会从视觉大模型向通用多模态大模型进军。大模型未来要靠“两条腿”走路唐文斌表示,多模态大模型是通向AGI(通用人工智能)的必由之路。大模型是当前AI
2023-07-08 10:48:00
更多关于汽车的资讯: