• 我的订阅
  • 头条热搜
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...ro和阿里的Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...示视频结果看,市面上现有的全部多模态大模型与Gemini的性能表现都有代际差,包括Meta 5月开源的跨6个模态的AI模型ImageBind以及GPT-4。图源:谷歌今年4月开始,随着多模态技术不断升级,以及叠加模型调用成本等性能的优化,GPT...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...基于 SigLIP 的 PaLI 在各种多模态基准测试中表现出卓越的性能,特别是在定位和文本理解方面。相关研究论文以“PaLI-3 Vision Language Models: Smaller, Faster, Stronger”为题,已发表到预印本网站 arXiv 上。研究团队认为,仅有 ……更多
苹果公司公布“mm1”多模态大模型
...关键因素。研究表明,图像分辨率和图像标记数量对模型性能影响较大,视觉语言连接器对模型的影响较小,不同类型的预训练数据对模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...良好训练的MoE可取得比同等激活参数量的稠密模型更好的性能。“但这仅仅是一个起点,未来还会有更加高效的稀疏模型结构出现。”林达华表示,这些架构现在还停留在学术研究阶段,但随着验证的逐渐成功,它们会慢慢进入...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原因,他们发现对于视频理解来说,被识别对象的静态外观并不是很重要,有时...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...识任务和机器人相关任务的推理能力,并都取得了先进的性能表现。同时,本文发现当 RoboMamba 具备强大的推理能力后,我们可以通过极低的训练成本使得 RoboMamba 掌握多种操纵位姿预测能力。 论文:RoboMamba: Multimodal State Space Mo...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...驶基于黑盒化的深度学习模型,因此如何提高模型的驾驶性能、以及提高模型的可解释性,是一个急需解决的问题和痛点。现有的大量方法都是端到端自动驾驶,徐冬阳和所在团队详细分析模型结构之后发现,此前人们并没有很...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...也是备受关注的问题。唐杰认为,缩放定律描述了大模型性能与其参数量、数据规模、计算量之间的关系。虽然备受质疑,但直到今天,可能高质量的缩放仍然是提高大模型性能的重要方法。“一方面,这几个因素相互关联,参...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...环境。 推理一体机:该款一体机聚焦于为客户提供高性能全场景推理算力,产品预置了完备的大模型推理工具集,可大幅提高部署运维大模型推理应用的便利性,通过重构算子等一系列深度优化,极大提升推理算力效率,释...……更多
浪潮信息推出as13000g7-n系列
...达到极致,减少不必要的资源浪费,训练阶段的数据读写性能成为重中之重。而想要提升算力利用率、降低模型训练成本,必须要在数据存储性能上进行创新。AS13000G7-N系列具备强大的端到端性能优化能力,这也是模型训练阶段...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参数规模,达到比肩大模型的性能,是需要解决的难题。“以小博大”的励志故事,2023年9月发生在法国AI独角兽Mistral上。其发布的开源...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...牌数量对模型进行排序,如果金牌数量相同,则按照整体性能分数来排序。实验结果表明:Claude-3.5-Sonnet在整体表现上与GPT-4o相比极具竞争力,甚至在一些科目上超过了GPT-4o(比如在物理、化学和生物学上)。 Gemini-1.5-Pro和GPT-4V...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
... 1.3B 的小模型。研究人员表示:“DeepSeek-VL 1.3B 小模型的性能同样强悍,在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用,也更方便在手机等移动终端上部署。日前,相关论文以《DeepSeek-VL:面向真...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...员也都发文祝贺谷歌:△来源:X听说读写样样行,多项性能超越GPT-4,有任务首次超越人类 “Gemini,从第一天起就是多模态大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...,并解决版权和标注数据质量的问题,就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中,他们将继续迭代优化模型性能,提升模型泛化性,以更好地适应国内用户的需求。参考资料:1.S., Liu, A., Hu...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...变了大模型领域ChatGPT独领风骚的局面。Gemini 不仅在很多性能上超过了ChatGPT 4,它同时带来了另一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...果更好的主要因素有:图像分辨率和图像标记数量对模型性能影响较大,比如更高清的图像,标注的细节越多,模型的效果就更好。视觉语言连接器对模型的影响较小,视觉语言连接器指的是可以将图像和文本结合起来,进行信...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...这说明模型所输出的负样本倾向于正样本,模型的误差和性能下界提升。通过可视化attention可以看到,CSR能使得LVLM更加偏重于视觉模型,同时能缓解文本attention中存在的上下文依赖问题。 ……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...对现有多模态大模型进行了基准测试,发现 Ferret 的平均性能较最出色的原有大模型高 20.4%,而且在物体识别的幻觉方面也有所减轻。 概括来讲,Ferret 项目论文的贡献主要为以下三个方面:结束语很明显,苹果正在努力追赶这...……更多
...SmartTrim。凭借精细化的剪枝策略,SmartTrim能够在保持模型性能的同时,大幅提升计算效率。自适应剪枝能力,智能识别并剪除不必要的计算负担在视觉语言大模型(VLM)的研究和应用中,高计算成本一直是制约其广泛部署的主要...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...云大模型和车端BEV检测模型的输出结果,可快速发现模型性能问题,诸如车辆分类错误、行人漏检等,由此可以进行针对性的解决。同时,轻舟智航还提出了一种高效的跨模态知识蒸馏方法,可利用离线模型提升车端线上基于BEV...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...rmer 引擎,其变压器引擎可提供 800 teraflops 的 8 位浮点 AI 性能,运行带宽达 100GB/s,AI 计算性能达 800TFLOPs,多层次规划能力卓越,以运行 GR00T 等多模式生成式 AI 模型。凭借集成的功能安全处理器、高性能 CPU 集群和 100GB 以太网……更多
小模型正在成为AI界的新宠
...理和学习的复杂性直接相关。模型容量越大,往往意味着性能越好。随着模型容量增加到数万亿个参数,大模型可以捕捉更复杂的模式,从而在自然语言处理、计算机视觉和其他任务上表现更好,具备更像人类的能力。另一方面...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...技播客主持人DwarkeshPatel采访时透露,后训练是提高模型性能的关键因素。GPT-4o的识图能力有多牛?四大维度深度体验基于图片类型,记者将识图功能的测评分为4大维度,分别为普通图像、特定专业领域的图像、数据图像和手写...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模型有不少相似处,而且没有任何相关致谢或引用。一开始团队面对抄袭质疑还嘴硬...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...极端场景数据集ACDC(包含雨、雾、雪、夜等复杂场景)性能验证中,星睿AI DRIVE大模型均拿下实时排行榜第一名,位于国际领先水平。 强大的AI大模型,自然离不开强大的算力底座。星睿AI大模型基于全球首个“云、数、智”一...……更多
更多关于科技的资讯:
创维与田径新星吴艳妮强强联手推出全新品牌tvc视频
近日,国内知名家电品牌创维与田径新星吴艳妮强强联手,共同推出了全新品牌TVC视频,这一举措标志着创维在品牌建设和市场推广上迈出了坚实一步
2024-10-11 20:07:00
中东中亚出海新篇:何时出发,与谁同行?
基建领域,总投资5000亿美元的沙特新未来城项目已经逐步落地;科创领域,“利雅得狂欢季”乐园用上来自中国的AI、AR技术
2024-10-11 20:09:00
“星火小澄” 助力乡村振兴
本文转自:人民网-江西频道近年来,南昌市东湖区烟草专卖局以“星火小澄”授牌终端建设为契机,坚持数字驱动,大力发展科技化
2024-10-11 20:19:00
ColorOS 15开发者大会正式登场
今天,中关村在线收到了2024OPPO开发者大会的邀请函,包装上印有本届开发者大会的宣传语——AI,更进一步。包装内分别是一张印有本次OPPO开发者大会相关信息的卡片和一个小盒子
2024-10-11 19:54:00
安徽大学人工智能研究方向9位学者荣登全球前2%顶尖科学家榜单
大皖新闻讯 近日,美国斯坦福大学和国际权威学术出版社爱思唯尔(Elsevier)共同发布了2024年度全球前2%顶尖科学家榜单(World's Top 2% Scientists 2024)
2024-10-11 20:01:00
欧洲杯,变成中国品牌的“主场”
自6月15日凌晨的揭幕战开始,为期一个月的2024欧洲杯正在持续制造热门话题。同样享受到红利的,正是那些提前布局的赞助商
2024-10-11 20:07:00
问界M9上市9个多月成为50万以上车型销量冠军
10月10日,AITO汽车官宣,旗下问界M9上市9个多月以来,累计大定突破150000辆,成为50万以上车型销量冠军。此外
2024-10-11 20:10:00
小米15系列大概率在10月28日正式发布
就在昨天,很多米粉都表示身边的小米之家纷纷宣布开启小米15系列的盲订,提前支付100元的订金就能在新机发布后第一时间拿到产品
2024-10-11 20:10:00
买新兴改善家电的身边人对产品有哪些评价?
作为家电编辑,也经常会收到来自身边朋友和同事对家电产品的使用反馈,这些最真实的意见其实对于大家买家电来说是最具参考价值的
2024-10-11 20:11:00
《直到黎明》重制版登陆steam平台
SupermassiveGames团队以其独特的互动式电影游戏和恐怖元素结合的叙事手法在游戏中得到了广泛的认可,为玩家们带来《直到黎明》
2024-10-11 20:12:00
iqoo13全球首发boe最新q10发光材料
十月伊始,各家手机厂商的旗舰产品都已进入预热阶段,其中备受瞩目的iQOO旗下数字旗舰新品iQOO13,也于今日亮相2024vivo开发者大会现场
2024-10-11 20:14:00
七彩虹z890主板发布:ai潮流旗舰
北京时间2024年10月10日23:00,Intel正式推出了备受瞩目的英特尔酷睿Ultra台式机处理器(第二代)。这一系列处理器采用了性能核心与效能核心的混合架构设计
2024-10-11 20:14:00
amd第五代epyc处理器性能升级
在6月份的台北电脑展上小秀一把第五代EPYC处理器之后,业界对于这一全新高密度数据中心CPU的期待值越来越高。而在近日举办的AdvancingAI2024大会上
2024-10-11 20:15:00
菱云行业周知|人工智能在汽车行业中的优势;智驾产业化加速发展
本周焦点:人工智能在汽车行业中的优势人工智能在汽车行业中成为不可或缺的一部分,它改变了传统方法,并为曾经被认为不可能的进步创造了机会
2024-10-11 20:40:00
原价68.9 元:平仄Tritan材质700ml吸管杯19元大差价(玻璃款29元)
平仄Tritan材质吸管杯日常售价为68.9元,下单领49元优惠券,到手19.9元。另有玻璃款到手价为 29.9 元。有珍珠白和黑曜红两种颜色可以选择
2024-10-11 20:43:00