• 我的订阅
  • 头条热搜
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...ro和阿里的Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...示视频结果看,市面上现有的全部多模态大模型与Gemini的性能表现都有代际差,包括Meta 5月开源的跨6个模态的AI模型ImageBind以及GPT-4。图源:谷歌今年4月开始,随着多模态技术不断升级,以及叠加模型调用成本等性能的优化,GPT...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...基于 SigLIP 的 PaLI 在各种多模态基准测试中表现出卓越的性能,特别是在定位和文本理解方面。相关研究论文以“PaLI-3 Vision Language Models: Smaller, Faster, Stronger”为题,已发表到预印本网站 arXiv 上。研究团队认为,仅有 ……更多
苹果公司公布“mm1”多模态大模型
...关键因素。研究表明,图像分辨率和图像标记数量对模型性能影响较大,视觉语言连接器对模型的影响较小,不同类型的预训练数据对模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...良好训练的MoE可取得比同等激活参数量的稠密模型更好的性能。“但这仅仅是一个起点,未来还会有更加高效的稀疏模型结构出现。”林达华表示,这些架构现在还停留在学术研究阶段,但随着验证的逐渐成功,它们会慢慢进入...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原因,他们发现对于视频理解来说,被识别对象的静态外观并不是很重要,有时...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...驶基于黑盒化的深度学习模型,因此如何提高模型的驾驶性能、以及提高模型的可解释性,是一个急需解决的问题和痛点。现有的大量方法都是端到端自动驾驶,徐冬阳和所在团队详细分析模型结构之后发现,此前人们并没有很...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...环境。 推理一体机:该款一体机聚焦于为客户提供高性能全场景推理算力,产品预置了完备的大模型推理工具集,可大幅提高部署运维大模型推理应用的便利性,通过重构算子等一系列深度优化,极大提升推理算力效率,释...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参数规模,达到比肩大模型的性能,是需要解决的难题。“以小博大”的励志故事,2023年9月发生在法国AI独角兽Mistral上。其发布的开源...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
... 1.3B 的小模型。研究人员表示:“DeepSeek-VL 1.3B 小模型的性能同样强悍,在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用,也更方便在手机等移动终端上部署。日前,相关论文以《DeepSeek-VL:面向真...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...员也都发文祝贺谷歌:△来源:X听说读写样样行,多项性能超越GPT-4,有任务首次超越人类 “Gemini,从第一天起就是多模态大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...,并解决版权和标注数据质量的问题,就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中,他们将继续迭代优化模型性能,提升模型泛化性,以更好地适应国内用户的需求。参考资料:1.S., Liu, A., Hu...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...变了大模型领域ChatGPT独领风骚的局面。Gemini 不仅在很多性能上超过了ChatGPT 4,它同时带来了另一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...果更好的主要因素有:图像分辨率和图像标记数量对模型性能影响较大,比如更高清的图像,标注的细节越多,模型的效果就更好。视觉语言连接器对模型的影响较小,视觉语言连接器指的是可以将图像和文本结合起来,进行信...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...对现有多模态大模型进行了基准测试,发现 Ferret 的平均性能较最出色的原有大模型高 20.4%,而且在物体识别的幻觉方面也有所减轻。 概括来讲,Ferret 项目论文的贡献主要为以下三个方面:结束语很明显,苹果正在努力追赶这...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...云大模型和车端BEV检测模型的输出结果,可快速发现模型性能问题,诸如车辆分类错误、行人漏检等,由此可以进行针对性的解决。同时,轻舟智航还提出了一种高效的跨模态知识蒸馏方法,可利用离线模型提升车端线上基于BEV...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...极端场景数据集ACDC(包含雨、雾、雪、夜等复杂场景)性能验证中,星睿AI DRIVE大模型均拿下实时排行榜第一名,位于国际领先水平。 强大的AI大模型,自然离不开强大的算力底座。星睿AI大模型基于全球首个“云、数、智”一...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...PT”。据透露,该团队的任务是在今年年底前达到GPT-3.5的性能,在2024年年中达到GPT-4的性能。目前Seed大约有2000亿个参数。相比之下,GPT-3.5有1750亿个参数。 阿里云首席商业官蔡英华离职阿里云首席商业官蔡英华(花名:华琰)...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...oud TPU v5p。谷歌表示,在六项基准测试中,大杯的Gemini Pro性能表现优于GPT-3.5;而在30项性能基准测试中,超大杯Gemini Ultra超越了目前最强模型GPT-4。甚至,Gemini Ultra在MMLU测试上得分高达90.0%,即数学、物理、法律等57个领域测试.……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。历经一年...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...表现。 此外,Meta 也测试了 Llama 3 在真实世界场景中的性能。他们专门开发了一个新的高质量人类评估集,该评估集包含 1800 个提示,涵盖 12 种关键用例(征求建议、头脑风暴、分类、封闭式问题解答、编码、创意写作、提取...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...模型等。这些方式虽然能提升上下文窗口长度,但对模型性能均有不同程度的损害,换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。因此,如何在提高上下文支持长度的同时,保证处理能力的提升是目前业界...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...映射关系,从而能够实现“以图生文”、“以文生图”等性能。2026年数据预言是真是假?数据,是人工智能赖以发展的核心资源。如何解决“数据瓶颈”是未来一段时期我们即将面临或已经面临的挑战。据业内人士分析,GPT-3于...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GPT-4,引发众多猜测后被Mistral联合创始人证实,是此前一款公开的量化模型被泄露。字节跳动...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ul.……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...本嵌入模型:text-embedding-3-small和text-embedding-3-large,前者性能比前代模型大幅提升,价格降至1/5;后者能创建最高3072维数的嵌入,性能更强,价格亦十分经济。GPT-3.5 Turbo的新版本也将推出,输入价格降低50%,输出价格减少25%。.……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
...高度准确和广泛的泛化能力,融入手机系统能够增强手机性能,而且随着AI算法的进化,大模型手机能够基于用户数据分析提供个性化服务,实现“千人千机”。一面是,AI大模型厂商积极挺进硬件领域(智能手机、智能学习机...……更多
更多关于科技的资讯:
到2100年 气候变化将威胁到全球三分之二的温带雨林
一项研究强调了气候变化对温带雨林的严重影响,到 2100 年,温带雨林的损失可能高达 68%。 该研究强调了这些森林在碳储存方面的关键作用
2024-11-13 09:59:00
魅族新旗舰消息传来,商用或到明年了
不知道大家发现没有在这波高通骁龙8至尊版旗舰井喷的过程之中,没有看到魅族的身影。行业也没有传出关于魅族新旗舰的消息。于是大家都想知道魅族新旗舰什么时候现身
2024-11-13 10:00:00
双十一京东与天猫平台值得入手的显卡有哪些?
今天是各大电商平台的狂欢日,也就是双十一活动的当天!目前双十一已经迎来最后的优惠狂欢,想要配电脑买显卡的小伙伴赶紧看过来
2024-11-13 10:10:00
虎牙公司(NYSE:HUYA)于北京时间2024年11月12日晚间(美国东部时间11月12日美国股市开盘前)公布了2024年第三季度财报
2024-11-13 10:12:00
幸福医药70年,携手合作伙伴共启新征程
自1954年成立以来,幸福医药已迎来第70个年头。值此70周年之际, 2024年10月24日-26日,幸福医药在中国香港举办“幸福70年共启新征程”走进幸福医药高层私享会
2024-11-13 10:17:00
闪迪至尊超极速microSDXC UHS-I存储卡上市:2TB首发1569元
快科技11月13日消息,西部数据旗下品牌闪迪推出了至尊超极速microSDXC UHS-I存储卡2TB版,这是西部数据首款
2024-11-13 10:18:00
小鹏汽车前智驾负责人加入比亚迪!曾深度参与无图智驾开发
快科技11月13日消息,据媒体报道,小鹏汽车前智能驾驶领域负责人刘懿现已加盟比亚迪,担任自研智能驾驶规控业务的负责人,直接向自研智驾团队总负责人李锋汇报
2024-11-13 10:18:00
叮咚买菜换五月天萝卜头像被指蹭热度!官方回应:找点乐子玩脱了
快科技11月13日消息,近日,有网友发现叮咚买菜小红书账号的头像换成了五月天阿信潮牌“STAYREAL”IP的胡萝卜形象
2024-11-13 10:18:00
比亚迪百万豪华轿车 仰望U7内饰官图发布:中轴对称美学
快科技11月13日消息,仰望汽车官方发布了旗下百万级豪华轿车U7的内饰官图,并称其为“星环座舱,打造划时代旗舰座舱体验
2024-11-13 10:18:00
沛县农商银行开展上线安防综合管理平台培训暨消防安全专项培训活动
为切实提高安全保卫工作的规范化管理水平和落实消防安全责任。近日,沛县农商银行组织开展上线安防综合管理平台暨“消防宣传月”安全演练专项培训活动
2024-11-13 10:21:00
“双十一”浙江线下商超不玩套路 直接长期降价
消费日报网讯(记者 叶德宝 马佳丽)今年“双十一”,浙江线下商超玩起了不一样的“心跳加速”——全面降价,不玩预售、尾款
2024-11-13 10:22:00
沛县农商银行积极响应监管要求,全面启动针对“沉睡账户”的专项清理与激活工作,旨在通过多项创新举措提升服务质量与客户满意度
2024-11-13 10:22:00
科路睿面临外观设计专利侵权诉讼,引发医疗增材制造领域关注
2024年9月,科路睿(天津)生物技术有限公司收到了来自天津市第二中级人民法院的传票,武汉必盈生物股份有限公司正式对其提起外观设计专利侵权诉讼
2024-11-13 10:23:00
2024年11月13日GlobalInfoResearch调研机构发布了《全球道路送货机器人行业总体规模、主要厂商及IPO上市调研报告
2024-11-13 10:34:00
智慧工地新篇章:九测科技闸机测酒仪引领工地安全管理变革
随着科技的飞速发展,智慧化理念已深深植根于各行各业,建筑行业也不例外。在追求高效、智能的施工管理过程中,智慧工地应运而生
2024-11-13 10:36:00