• 我的订阅
  • 头条热搜
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...ro和阿里的Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本大模型经过多年的发展,逐渐发展成了统一的纯解码器Transformer架...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...像等多模态任务处理“书生2.5”在图文跨模态领域卓越的性能表现来自于视觉、语言及多任务建模三大模型能力的有效融合,即InternImage-G通用视觉大模型、用于文本理解的超大语言预训练模型(LLM)和用于多任务的兼容解码建...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...示视频结果看,市面上现有的全部多模态大模型与Gemini的性能表现都有代际差,包括Meta 5月开源的跨6个模态的AI模型ImageBind以及GPT-4。图源:谷歌今年4月开始,随着多模态技术不断升级,以及叠加模型调用成本等性能的优化,GPT...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...充分探索。本文首通过评估现有方法在图像-标题对上的性能来探索这一背景,由于在该场景中缺乏标签,之前的无法有效地推广到多模态数据,并且在建立捷径方面的效果有限。在本文中提出了多步误差最小化(MEM),这是一...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...基于 SigLIP 的 PaLI 在各种多模态基准测试中表现出卓越的性能,特别是在定位和文本理解方面。相关研究论文以“PaLI-3 Vision Language Models: Smaller, Faster, Stronger”为题,已发表到预印本网站 arXiv 上。研究团队认为,仅有 ……更多
苹果公司公布“mm1”多模态大模型
...关键因素。研究表明,图像分辨率和图像标记数量对模型性能影响较大,视觉语言连接器对模型的影响较小,不同类型的预训练数据对模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...,实验结果表明该研究在 VideoMME 和长视频字幕任务上的性能持续提高(图 2)。在 1024 帧上训练的 LongVILA 模型在 1400 帧的大海捞针实验中实现了 99.5% 的准确率,相当于 274k 个 token 的上下文长度。此外, MM-SP 系统可以有效地将...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...的关键在于通过改进半监督学习技术来提高模型情感识别性能,比如预测情绪类别的准确率。自 5 月大赛启动起,两个月时间,来自全球近百支参赛队伍展开了角逐,既不乏知名高校也有创企新势力。其中Semi 赛道第一名由社交...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...些查询留在设备上,哪些可能需要由云端的更大模型处理性能评估结果显示,Llama 3.2视觉模型在图像识别等任务上,与Claude 3 Haiku和GPT-4o mini不相上下。3B模型在遵循指令、总结、提示词重写和工具使用等任务上,表现优于Gemma 2 2...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...良好训练的MoE可取得比同等激活参数量的稠密模型更好的性能。“但这仅仅是一个起点,未来还会有更加高效的稀疏模型结构出现。”林达华表示,这些架构现在还停留在学术研究阶段,但随着验证的逐渐成功,它们会慢慢进入...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原因,他们发现对于视频理解来说,被识别对象的静态外观并不是很重要,有时...……更多
比ChatGPT省电10倍 Google研训练AI模型新方法
...emma 2等模型表明,更少但高品质的数据可以实现更强大的性能。若要筛选出高品质的数据,关键是需创建有效的数据渠道。现在大致分为手动管理和基于模型的数据管理方法,但前者成本高且难以扩展,而后者则有望为多模态大...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...识任务和机器人相关任务的推理能力,并都取得了先进的性能表现。同时,本文发现当 RoboMamba 具备强大的推理能力后,我们可以通过极低的训练成本使得 RoboMamba 掌握多种操纵位姿预测能力。 论文:RoboMamba: Multimodal State Space Mo...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...态的全面评估和改进。全模态大模型与全模态对齐大模型性能的最后一块拼图 人类在日常生活中接收到的信息往往是全模态的,不同的感官渠道能够互相补充,帮助我们更全面地理解和表达复杂的概念。这种全模态的信息流对...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...驶基于黑盒化的深度学习模型,因此如何提高模型的驾驶性能、以及提高模型的可解释性,是一个急需解决的问题和痛点。现有的大量方法都是端到端自动驾驶,徐冬阳和所在团队详细分析模型结构之后发现,此前人们并没有很...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...过了GPT-4V和Claude-3-Sonnet(表2)。虽然模型在微调后出现性能提升属于正常现象,但这种微调效率可以侧面证明合成数据的潜力,尤其是在质量、有效性和多样性方面。除了在原基准上有所进步,微调后的模型在ChatQA、MathVista这...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...也是备受关注的问题。唐杰认为,缩放定律描述了大模型性能与其参数量、数据规模、计算量之间的关系。虽然备受质疑,但直到今天,可能高质量的缩放仍然是提高大模型性能的重要方法。“一方面,这几个因素相互关联,参...……更多
华人团队爆火instructblip抢跑看图聊天
...。最最重要的是,InstructBLIP在多个任务上实现了最先进的性能,甚至在图片解释和推理上表现优于GPT4。为啥如此之强?新王者:InstructBLIPInstructBLIP的主要意义就在于解决视觉-语言指令微调中的挑战,并对模型未见过的数据和任...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...环境。 推理一体机:该款一体机聚焦于为客户提供高性能全场景推理算力,产品预置了完备的大模型推理工具集,可大幅提高部署运维大模型推理应用的便利性,通过重构算子等一系列深度优化,极大提升推理算力效率,释...……更多
浪潮信息推出as13000g7-n系列
...达到极致,减少不必要的资源浪费,训练阶段的数据读写性能成为重中之重。而想要提升算力利用率、降低模型训练成本,必须要在数据存储性能上进行创新。AS13000G7-N系列具备强大的端到端性能优化能力,这也是模型训练阶段...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...对全模态大模型端侧化,vivo从算法模型设计,到量化、性能瓶颈分析工具建设,再到底层运行时异构方案设计和业务框架层灵活的多业务部署架构建设,提供了完整的解决方案。通过软硬件协同,充分挖掘芯片潜力,确保大模...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...优化分布式计算平台、节能数据中心、高速网络架构、高性能存储系统、训练容错与可靠性、数据安全平台、混合云计算及性能监控分析等系统和能力。“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参数规模,达到比肩大模型的性能,是需要解决的难题。“以小博大”的励志故事,2023年9月发生在法国AI独角兽Mistral上。其发布的开源...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...牌数量对模型进行排序,如果金牌数量相同,则按照整体性能分数来排序。实验结果表明:Claude-3.5-Sonnet在整体表现上与GPT-4o相比极具竞争力,甚至在一些科目上超过了GPT-4o(比如在物理、化学和生物学上)。 Gemini-1.5-Pro和GPT-4V...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...卓越的多模态处理能力、广泛的文档格式兼容性和极致的性能优化,成为企业文档处理领域的得力助手。智能提取,精准高效:集成前沿 NLP 算法与模型,实现文档处理速度与精度的双重飞跃。抽取精度高达 98%,问答响应准确率...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
... 1.3B 的小模型。研究人员表示:“DeepSeek-VL 1.3B 小模型的性能同样强悍,在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用,也更方便在手机等移动终端上部署。日前,相关论文以《DeepSeek-VL:面向真...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...员也都发文祝贺谷歌:△来源:X听说读写样样行,多项性能超越GPT-4,有任务首次超越人类 “Gemini,从第一天起就是多模态大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...CPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。在这个「亩产八万斤」,「10 天一个 SoTA」的时代,简单易用、标准透明、可复现的多模态评估框架变得越来越重要,而这并非易事。为解决以上问题,来自南洋理...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...算资源,保证在处理大规模多模态数据时仍能保持较高的性能和响应速度,使得模型的训练过程更加高效,收敛速度更快,性能更稳定。同时也得益于云从科技长期在视觉、语言领域的深厚积累和不断创新。图 4:从容大模型 - 2...……更多
更多关于科技的资讯:
一加李杰:以用户需求为核心,将持续打造优势产品力
【CNMO科技】从一加11开始,以“产品力优先”作为品牌理念一加手机,在数字系列旗舰中取消了Pro版本的机型,或者用一加自己的话来说
2024-11-02 14:44:00
抖音原生鸿蒙版大升级 直播、私信功能均已上线
【CNMO科技消息】自10月22日华为宣布HarmonyOSNEXT正式发布以来,鸿蒙生态的各类迭代、上新,一直是大家关注
2024-11-02 14:48:00
办公好搭子!华为千元档位护眼办公显示器开启预售
【CNMO科技消息】10月30日,全新一代华为MateViewSE护眼办公显示器正式开启预售,预售价849元。华为MateViewSE定位千元档位护眼办公显示器新选择
2024-11-02 14:48:00
华为智选Hi畅享新机曝光:支持40W快充 或11月发布
【CNMO科技消息】CNMO最新获悉,一款神秘的华为智选Hi畅享新机曝光,该机有望在11月正式发布。Hi畅享70近日,有数码博主爆料称
2024-11-02 14:49:00
4199元!华为Mate60Pro降价
华为Mate60Pro和荣耀Magic6Pro这两款手机经常被拿来比较,它们确实有不少相似之处,比如在系统操作上,用起来的感觉挺像的
2024-11-02 14:53:00
7寸大屏+骁龙8!这款新机太强悍了
各位玩友们,准备好大开眼界了吗?红魔这个名字,可是无数gamers心中的白月光啊,这次又要给我们带来新惊喜了!最近关于红魔10Pro的消息一波接一波
2024-11-02 14:54:00
总投资8亿元!淳安经开区常芯科创园项目开工
浙江在线11月2日讯 (通讯员 汪霞飞)11月2日,淳安经济开发区再度迎来先进制造赛道“高光时刻”,继2023年浙江常淳科技公司投产之后
2024-11-02 16:27:00
专家喊话公共洗手间男女例应是1比2:对女性最起码尊重
11月2日消息,原韩国驻英国大使、原韩国公共外交大使朴银夏接受媒体采访时表示,公共洗手间男女例应是1比2,这也样对女性的尊重
2024-11-02 16:35:00
新疆沙漠里竟然养出大海里的鱼虾:口感Q弹、肉质鲜美
快科技11月2日消息, 浙江大学近日宣布,该校援疆科技特派员在新疆沙漠成功养殖鱼虾。去年9月,特派员对阿拉尔市地下盐碱水进行了深入调研
2024-11-02 16:35:00
ZDS 数字股票 布局全球视野,开启智能金融新篇章
在全球金融市场蓬勃发展的背景下,ZealDigitalShares(ZDS)正迈向一个全新的发展阶段。通过采用先进技术与深度融合人工智能(AI)
2024-11-02 16:37:00
ZFX山海证券 AI驱动引领行业革新
在全球金融市场蓬勃发展的今天,众多新兴金融机构如雨后春笋般涌现。而在这其中,ZFX山海证券凭借其全球化扩展战略、严格的监管
2024-11-02 16:57:00
埃安巧用“三折叠手机”打广告:5平大床AION Y不要9.98万
快科技11月2日消息,埃安今日宣布AION Y车型推出重大促销活动,享受国家补贴、地方补贴以及厂家补贴,三重优惠叠加。有趣的是
2024-11-02 17:05:00
时代变了!英伟达纳入道琼斯指数 英特尔被取代
见证历史!最新消息,英伟达将在2024年11月8日替代英特尔成为道琼斯工业平均指数的组成成员。这是历史最悠久的美国市场指数之一
2024-11-02 17:05:00
不适合中国人用 厨余垃圾处理器连续4年大跌:降价也回天无力
快科技11月2日消息,奥维云网(AVC)数据显示,2024年1-9月厨余垃圾处理器行业零售额为4.1亿元,同比下降28
2024-11-02 17:05:00
首发原生鸿蒙!华为Mate 70系列即将官宣
快科技11月2日消息,博主厂长是关同学、定焦数码爆料,华为Mate 70系列即将官宣。从下周开始,Mate 70系列的细节信息就会露出
2024-11-02 17:35:00