• 我的订阅
  • 头条热搜
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...ro和阿里的Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...示视频结果看,市面上现有的全部多模态大模型与Gemini的性能表现都有代际差,包括Meta 5月开源的跨6个模态的AI模型ImageBind以及GPT-4。图源:谷歌今年4月开始,随着多模态技术不断升级,以及叠加模型调用成本等性能的优化,GPT...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...基于 SigLIP 的 PaLI 在各种多模态基准测试中表现出卓越的性能,特别是在定位和文本理解方面。相关研究论文以“PaLI-3 Vision Language Models: Smaller, Faster, Stronger”为题,已发表到预印本网站 arXiv 上。研究团队认为,仅有 ……更多
苹果公司公布“mm1”多模态大模型
...关键因素。研究表明,图像分辨率和图像标记数量对模型性能影响较大,视觉语言连接器对模型的影响较小,不同类型的预训练数据对模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...良好训练的MoE可取得比同等激活参数量的稠密模型更好的性能。“但这仅仅是一个起点,未来还会有更加高效的稀疏模型结构出现。”林达华表示,这些架构现在还停留在学术研究阶段,但随着验证的逐渐成功,它们会慢慢进入...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...驶基于黑盒化的深度学习模型,因此如何提高模型的驾驶性能、以及提高模型的可解释性,是一个急需解决的问题和痛点。现有的大量方法都是端到端自动驾驶,徐冬阳和所在团队详细分析模型结构之后发现,此前人们并没有很...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...环境。 推理一体机:该款一体机聚焦于为客户提供高性能全场景推理算力,产品预置了完备的大模型推理工具集,可大幅提高部署运维大模型推理应用的便利性,通过重构算子等一系列深度优化,极大提升推理算力效率,释...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参数规模,达到比肩大模型的性能,是需要解决的难题。“以小博大”的励志故事,2023年9月发生在法国AI独角兽Mistral上。其发布的开源...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
... 1.3B 的小模型。研究人员表示:“DeepSeek-VL 1.3B 小模型的性能同样强悍,在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用,也更方便在手机等移动终端上部署。日前,相关论文以《DeepSeek-VL:面向真...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...员也都发文祝贺谷歌:△来源:X听说读写样样行,多项性能超越GPT-4,有任务首次超越人类 “Gemini,从第一天起就是多模态大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...,并解决版权和标注数据质量的问题,就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中,他们将继续迭代优化模型性能,提升模型泛化性,以更好地适应国内用户的需求。参考资料:1.S., Liu, A., Hu...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...变了大模型领域ChatGPT独领风骚的局面。Gemini 不仅在很多性能上超过了ChatGPT 4,它同时带来了另一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...果更好的主要因素有:图像分辨率和图像标记数量对模型性能影响较大,比如更高清的图像,标注的细节越多,模型的效果就更好。视觉语言连接器对模型的影响较小,视觉语言连接器指的是可以将图像和文本结合起来,进行信...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...对现有多模态大模型进行了基准测试,发现 Ferret 的平均性能较最出色的原有大模型高 20.4%,而且在物体识别的幻觉方面也有所减轻。 概括来讲,Ferret 项目论文的贡献主要为以下三个方面:结束语很明显,苹果正在努力追赶这...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...云大模型和车端BEV检测模型的输出结果,可快速发现模型性能问题,诸如车辆分类错误、行人漏检等,由此可以进行针对性的解决。同时,轻舟智航还提出了一种高效的跨模态知识蒸馏方法,可利用离线模型提升车端线上基于BEV...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...极端场景数据集ACDC(包含雨、雾、雪、夜等复杂场景)性能验证中,星睿AI DRIVE大模型均拿下实时排行榜第一名,位于国际领先水平。 强大的AI大模型,自然离不开强大的算力底座。星睿AI大模型基于全球首个“云、数、智”一...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...PT”。据透露,该团队的任务是在今年年底前达到GPT-3.5的性能,在2024年年中达到GPT-4的性能。目前Seed大约有2000亿个参数。相比之下,GPT-3.5有1750亿个参数。 阿里云首席商业官蔡英华离职阿里云首席商业官蔡英华(花名:华琰)...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...oud TPU v5p。谷歌表示,在六项基准测试中,大杯的Gemini Pro性能表现优于GPT-3.5;而在30项性能基准测试中,超大杯Gemini Ultra超越了目前最强模型GPT-4。甚至,Gemini Ultra在MMLU测试上得分高达90.0%,即数学、物理、法律等57个领域测试.……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...表现。 此外,Meta 也测试了 Llama 3 在真实世界场景中的性能。他们专门开发了一个新的高质量人类评估集,该评估集包含 1800 个提示,涵盖 12 种关键用例(征求建议、头脑风暴、分类、封闭式问题解答、编码、创意写作、提取...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...模型等。这些方式虽然能提升上下文窗口长度,但对模型性能均有不同程度的损害,换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。因此,如何在提高上下文支持长度的同时,保证处理能力的提升是目前业界...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...映射关系,从而能够实现“以图生文”、“以文生图”等性能。2026年数据预言是真是假?数据,是人工智能赖以发展的核心资源。如何解决“数据瓶颈”是未来一段时期我们即将面临或已经面临的挑战。据业内人士分析,GPT-3于...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GPT-4,引发众多猜测后被Mistral联合创始人证实,是此前一款公开的量化模型被泄露。字节跳动...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ul.……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...本嵌入模型:text-embedding-3-small和text-embedding-3-large,前者性能比前代模型大幅提升,价格降至1/5;后者能创建最高3072维数的嵌入,性能更强,价格亦十分经济。GPT-3.5 Turbo的新版本也将推出,输入价格降低50%,输出价格减少25%。.……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
...高度准确和广泛的泛化能力,融入手机系统能够增强手机性能,而且随着AI算法的进化,大模型手机能够基于用户数据分析提供个性化服务,实现“千人千机”。一面是,AI大模型厂商积极挺进硬件领域(智能手机、智能学习机...……更多
ChatGPT一周年|炼制大模型芯片短缺数据有限,何以解忧?
...市值突破万亿美元,其领先市场的GPU(图形处理器)和高性能计算设施被全球科技企业争相抢购。“现在业内最好的(AI)芯片是英伟达的。”云知声智能科技股份有限公司董事长兼CTO梁家恩告诉澎湃科技,尽管也存在一些挑战...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...种中型多模态模型,针对多种任务的扩展进行了优化,其性能水平与谷歌迄今为止最大的模型1.0Ultra类似。谷歌增加了1.5Pro的上下文窗口容量,该大模型现在可以在生产环境中运行多达100万个token。这意味着1.5Pro可以一次性处理...……更多
更多关于科技的资讯:
小米15 Ultra曝光,这次惊喜太多了吧?
最近关于小米15 Ultra的消息频频传出,搞得大家心痒痒的。随着小米15和小米15 Pro的发布,小米15 Ultra也自然成了接下来的焦点
2024-11-15 09:50:00
传音itel S25系列手机发布 配备紫光展锐处理器和后置50MP主摄
【太平洋科技快讯】近日,传音控股在印度尼西亚雅加达举行新品发布会,正式推出itel S25和itel S25 Ultra系列智能手机
2024-11-15 09:50:00
华为果断“发飙”,从3999元跌至2549元,麒麟8000+6000万像素自拍+鸿蒙OS
一款手机要想打动人心,必须具备三大要素:看得顺眼、摸得舒坦、用得流畅。而这次要聊的华为nova12 Pro,无疑在这三个方面都交出了不错的成绩单
2024-11-15 09:50:00
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
继Anthropic之后,OpenAI也要接管人类电脑了?!就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”
2024-11-15 09:51:00
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-11-15 09:51:00
人形机器人+中科院+央企改革,狂揽上百亿订单,全市场仅此一家
明确告诉大家,人形机器人就是2020年的新能源。尤其是这家被中科院控股的人形机器人王者,值得大家重点关注。因为它不仅狂揽了上百亿订单
2024-11-15 09:51:00
KVB:量子互联网:构建未来互联网的技术框架
随着信息时代的飞速发展,互联网已经成为了我们日常生活中不可或缺的一部分。传统互联网在数据传输的速度、安全性和隐私保护等方面仍面临着诸多挑战
2024-11-15 09:51:00
小米发布智能底盘预研技术 能够跳舞还支持全自动驾驶
11月14日上午,小米汽车发布了一则视频,正式公布了小米汽车的最新研发成果——智能底盘预研技术。在视频中,雷军介绍了小米汽车最新的智能底盘技术
2024-11-15 09:51:00
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
智东西11月14日消息,据外媒The Information报道,一位参与工作的内部人士称,谷歌最近一直在为提升其聊天机器人产品Gemini的性能而努力
2024-11-15 09:51:00
那些进厂打工的机器人
随着人工智能和机器人技术的飞速发展,机器人能够完成越来越多之前只有人工才能完成的工作。这种技术的进步不仅提高了生产效率
2024-11-15 09:52:00
迎战寒潮 | 解锁冬季无人机锂电池——高效使用与保养秘籍
ZENFON随着冬季的脚步日益临近,寒潮的威胁也悄然逼近。对于无人机飞手而言,如何在寒冷的气候条件下维护和优化无人机的锂电池性能
2024-11-15 09:52:00
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势
2024-11-15 09:52:00
又一AI芯片独角兽,启动上市
11月13日,证监会官网显示,国产GPU独角兽企业摩尔线程智能科技(北京)股份有限公司(下称“摩尔线程”)在北京证监局办理辅导备案登记
2024-11-15 09:53:00
刚刚,谷歌宣布35岁Keras之父Francois Chollet离职
「再见,并感谢您一直以来的合作,Francois Chollet!」今天,一封发布于 Google for Developers 网站的公开信
2024-11-15 09:53:00
荣耀新机推出AI智能体 开启人机交互新篇章
日前,荣耀年度AI旗舰手机——荣耀Magic7系列正式发布,其搭载的AI智能体的创新,重新释放了智能手机的能力。如今,AI智能体正以其独特的自主性和交互性
2024-11-15 09:53:00