• 我的订阅
  • 头条热搜
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...ro和阿里的Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...示视频结果看,市面上现有的全部多模态大模型与Gemini的性能表现都有代际差,包括Meta 5月开源的跨6个模态的AI模型ImageBind以及GPT-4。图源:谷歌今年4月开始,随着多模态技术不断升级,以及叠加模型调用成本等性能的优化,GPT...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...基于 SigLIP 的 PaLI 在各种多模态基准测试中表现出卓越的性能,特别是在定位和文本理解方面。相关研究论文以“PaLI-3 Vision Language Models: Smaller, Faster, Stronger”为题,已发表到预印本网站 arXiv 上。研究团队认为,仅有 ……更多
苹果公司公布“mm1”多模态大模型
...关键因素。研究表明,图像分辨率和图像标记数量对模型性能影响较大,视觉语言连接器对模型的影响较小,不同类型的预训练数据对模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...良好训练的MoE可取得比同等激活参数量的稠密模型更好的性能。“但这仅仅是一个起点,未来还会有更加高效的稀疏模型结构出现。”林达华表示,这些架构现在还停留在学术研究阶段,但随着验证的逐渐成功,它们会慢慢进入...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原因,他们发现对于视频理解来说,被识别对象的静态外观并不是很重要,有时...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...驶基于黑盒化的深度学习模型,因此如何提高模型的驾驶性能、以及提高模型的可解释性,是一个急需解决的问题和痛点。现有的大量方法都是端到端自动驾驶,徐冬阳和所在团队详细分析模型结构之后发现,此前人们并没有很...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...环境。 推理一体机:该款一体机聚焦于为客户提供高性能全场景推理算力,产品预置了完备的大模型推理工具集,可大幅提高部署运维大模型推理应用的便利性,通过重构算子等一系列深度优化,极大提升推理算力效率,释...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参数规模,达到比肩大模型的性能,是需要解决的难题。“以小博大”的励志故事,2023年9月发生在法国AI独角兽Mistral上。其发布的开源...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
... 1.3B 的小模型。研究人员表示:“DeepSeek-VL 1.3B 小模型的性能同样强悍,在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用,也更方便在手机等移动终端上部署。日前,相关论文以《DeepSeek-VL:面向真...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...员也都发文祝贺谷歌:△来源:X听说读写样样行,多项性能超越GPT-4,有任务首次超越人类 “Gemini,从第一天起就是多模态大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...,并解决版权和标注数据质量的问题,就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中,他们将继续迭代优化模型性能,提升模型泛化性,以更好地适应国内用户的需求。参考资料:1.S., Liu, A., Hu...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...变了大模型领域ChatGPT独领风骚的局面。Gemini 不仅在很多性能上超过了ChatGPT 4,它同时带来了另一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...果更好的主要因素有:图像分辨率和图像标记数量对模型性能影响较大,比如更高清的图像,标注的细节越多,模型的效果就更好。视觉语言连接器对模型的影响较小,视觉语言连接器指的是可以将图像和文本结合起来,进行信...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...对现有多模态大模型进行了基准测试,发现 Ferret 的平均性能较最出色的原有大模型高 20.4%,而且在物体识别的幻觉方面也有所减轻。 概括来讲,Ferret 项目论文的贡献主要为以下三个方面:结束语很明显,苹果正在努力追赶这...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...云大模型和车端BEV检测模型的输出结果,可快速发现模型性能问题,诸如车辆分类错误、行人漏检等,由此可以进行针对性的解决。同时,轻舟智航还提出了一种高效的跨模态知识蒸馏方法,可利用离线模型提升车端线上基于BEV...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...极端场景数据集ACDC(包含雨、雾、雪、夜等复杂场景)性能验证中,星睿AI DRIVE大模型均拿下实时排行榜第一名,位于国际领先水平。 强大的AI大模型,自然离不开强大的算力底座。星睿AI大模型基于全球首个“云、数、智”一...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...PT”。据透露,该团队的任务是在今年年底前达到GPT-3.5的性能,在2024年年中达到GPT-4的性能。目前Seed大约有2000亿个参数。相比之下,GPT-3.5有1750亿个参数。 阿里云首席商业官蔡英华离职阿里云首席商业官蔡英华(花名:华琰)...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。历经一年...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...oud TPU v5p。谷歌表示,在六项基准测试中,大杯的Gemini Pro性能表现优于GPT-3.5;而在30项性能基准测试中,超大杯Gemini Ultra超越了目前最强模型GPT-4。甚至,Gemini Ultra在MMLU测试上得分高达90.0%,即数学、物理、法律等57个领域测试.……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...表现。 此外,Meta 也测试了 Llama 3 在真实世界场景中的性能。他们专门开发了一个新的高质量人类评估集,该评估集包含 1800 个提示,涵盖 12 种关键用例(征求建议、头脑风暴、分类、封闭式问题解答、编码、创意写作、提取...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...映射关系,从而能够实现“以图生文”、“以文生图”等性能。2026年数据预言是真是假?数据,是人工智能赖以发展的核心资源。如何解决“数据瓶颈”是未来一段时期我们即将面临或已经面临的挑战。据业内人士分析,GPT-3于...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...模型等。这些方式虽然能提升上下文窗口长度,但对模型性能均有不同程度的损害,换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。因此,如何在提高上下文支持长度的同时,保证处理能力的提升是目前业界...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GPT-4,引发众多猜测后被Mistral联合创始人证实,是此前一款公开的量化模型被泄露。字节跳动...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ul.……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...本嵌入模型:text-embedding-3-small和text-embedding-3-large,前者性能比前代模型大幅提升,价格降至1/5;后者能创建最高3072维数的嵌入,性能更强,价格亦十分经济。GPT-3.5 Turbo的新版本也将推出,输入价格降低50%,输出价格减少25%。.……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
...高度准确和广泛的泛化能力,融入手机系统能够增强手机性能,而且随着AI算法的进化,大模型手机能够基于用户数据分析提供个性化服务,实现“千人千机”。一面是,AI大模型厂商积极挺进硬件领域(智能手机、智能学习机...……更多
更多关于科技的资讯:
勤哲Excel服务器自动生成快递企业函件业务管理系统
众所周知,快递枢纽网络是畅通经济循环、连通全国统一大市场的重要基础设施。一个个小小的快递包裹,连接着千城百业,沟通了供需两端
2024-09-12 10:45:00
创业10周年,近日中国本土品牌永璞咖啡在故宫博物院附近开出了北京首店;与游戏大作《黑神话:悟空》联名,瑞幸咖啡新推“腾云美式”引发各地点单热
2024-09-12 10:58:00
夸克发布全新CueMe 打造“超能写”的智能对话助手
缺少一个真正强大好用的AI写作助手?“CueMe”就行!9月12日,夸克发布全新智能对话助手CueMe。据了解,CueMe是基于夸克大模型自主研发
2024-09-12 11:00:00
新能源汽车用户伤不起!充电占位费被吐槽太贵 特斯拉每小时最高384元
快科技9月12日消息,对于新能源车主来说,汽车充电占位费真的是不能忽视,因为有的厂商要价确实太狠了。据国内媒体报道称,目前不同充电站点“超时占用费”收费不同
2024-09-12 11:16:00
99.9万起 名爵全新电动车印度开卖:换标宝骏、不配电池
快科技9月12日消息,当地时间本月11日,名爵MG Windsor EV正式登陆印度市场,在当地的起售价为99.9万印度卢比(当前约84689元人民币)
2024-09-12 11:16:00
黄仁勋谈加速计算:NVIDIA可将应用程序速度提升100倍!
快科技9月12日消息,在高盛Communacopia Tech大会上,NVIDIA创始人兼CEO黄仁勋深入讨论了通用计算与加速计算的区别
2024-09-12 11:16:00
火烧修复5年 耗费超50亿!法国巴黎圣母院将于12月8日开放
快科技9月12日消息,据法国RCF广播电台报道,巴黎圣母院在经历了大火和漫长的修复后,将于2024年12月8日重新对公众开放
2024-09-12 11:16:00
增程并不落后!8月销量翻倍:比插混还猛
快科技9月12日消息,乘联会数据显示,2024年8月增程式批发销量11.5万辆、同比增长109%,显示出人们对于这种车型的强烈喜爱
2024-09-12 11:16:00
覆盖445个服务区、58个出入口!理想汽车第500座高速超充站上线
快科技9月12日消息,理想汽车近日宣布,其第500座高速超充站已正式投入运营。截至9月11日,高速超充站的总数增至503座
2024-09-12 11:16:00
助力南京在全球科技集群百强榜中排名上升,在宁高校专利成绩亮眼“从0到1,从1到10”,顶天立地做科研□南京日报/紫金山新闻记者何洁南京市市场监管局最新公布的一组数据显示
2024-09-12 11:27:00
商报讯 以人工智能为代表的数字技术,引领着数智时代加速到来。第三届全球数字贸易博览会将于9月25日至29日在杭州举办。作为一场全球关注的顶级盛会
2024-09-12 11:29:00
商报讯 想象一下,在虚拟的会议室里,拥有逼真外观和生动表情的“数字人”依次坐在各自座位上,他们不仅能够流畅地交谈,还能围绕主持人给出的命题结合各自的专业知识给出解决方案
2024-09-12 11:29:00
微短剧“流量为王”惹消费争议 “剧”离精品还有多远?
图为因内容低俗下架的微短剧《我在古代开超市》图为河马剧场APP的“看剧提现”版块 本报讯 (记者 卢 岳 □ 王鑫坤)影视行业在近些年实现了飞速发展
2024-09-12 11:31:00
“金钥匙”闪耀,光莆亮相第24届“九八投洽会”
9月8日-11日,由商务部主办,福建省人民政府、厦门市人民政府、商务部投资促进事务局承办的第二十四届中国国际投资贸易洽谈会(简称投洽会)在厦门国际会展中心盛大召开
2024-09-12 11:45:00
锐龙9000旗舰座驾!华硕ROG CROSSHAIR X870E HERO主板图赏
快科技9月11日消息,锐龙9000系列处理器上市不久,各大主板厂商纷纷推出了相应的800系主板,其中ROG也在第一时间推出了基于X870E主板芯片的ROG CROSSHAIR X870E HERO
2024-09-12 11:46:00