• 我的订阅
  • 头条热搜
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...深刻的 3D 效果,上一次出圈是在 SIGGRAPH 上:在 2021 年,英伟达在这个舞台上介绍了给黄仁勋制作 3D 模型的方法,以假乱真的效果震撼了世界。 而就在上周举行的 SIGGRAPH 2024 大会上,英伟达(NVDA.US)CEO黄仁勋同Meta的CEO扎克伯...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...60页的详细技术报告。消息一出,社交媒体瞬间炸了锅。英伟达AI科学家Jim Fan就第一时间转发评论:这是OpenAI王座的有力竞争者。 话不多说,一起来看更多细节。谷歌史上最强大模型Gemini在LLM中的表现,也正如我们刚才所述,32...……更多
Meta等成立AI联盟对抗OpenAI;春晚吉祥物“龙辰辰”被疑AI生成 | 图灵周报
...科学基金会等学术机构,但不包含ChatGPT开发公司OpenAI和英伟达。点评:该联盟将专注于负责任的AI技术开发,包括安全和安保工具,还将寻求增加开源AI模型的数量。自去年底OpenAI的ChatGPT推出以来,在人工智能赛道上,OpenAI已经...……更多
Sora爆火96小时国内大模型进场
...尽管国内大模型近年来取得显著进展,但与OpenAI、谷歌、英伟达等国际大公司相比,仍存在技术差距。这些国际大公司在深度学习、自然语言处理、计算机视觉等领域拥有更深厚的技术积累和研发实力,在AIGC领域具有更强的竞...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...,无疑成AI最大受益者。2、大模型淘金热的万卡起步,让英伟达股价飙升了 245%,市值解锁 万亿后停不下来,已突破1.2万亿美元,超过Facebook母公司Meta或特斯拉,跻身所谓“七巨头”。3、作为登上巅峰后迄今为止在互联网搜索...……更多
英国ai初创公司wayve公布gaia-1最新进展
...。▲图源WayveIT之家从官网得知,GAIA-1的世界模型经过64个英伟达A100GPU上长达15天的训练,包含了高达65亿个参数,而视频解码器则在32个英伟达A100GPU上训练了15天,总共拥有26亿个参数。GAIA-1的主要价值,是在自动驾驶中引入生成...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...us的CEO Brendan Iribe、创企孵化器YC的CEO陈嘉兴(Garry Tan)、英伟达研究员Timo Aila等专家及AI公司跟投,还收到了来自General Catalyst等一线基金的后续投资。该团队的顾问委员会,包括在内容创作行业拥有丰富经验的前迪士尼总裁Michae...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...在压缩去噪步数的同时可保持接近无损的性能。接下来,英伟达解决方案架构师赵一嘉从底层技术出发,讲解了文生图最主流的基于Unet的SD和DIT两种模型架构及其相应的特性,并介绍了英伟达的Tensorrt, Tensorrt-LLM, Triton, Nemo Megatron...……更多
腾讯混元文生图大模型升级并对外开源
...双语输入及理解,参数量15亿。运行该模型需要支持CUDA的英伟达GPU,单独运行混元DiT所需的最低显存为11GB,同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT则至少需要32GB的显存,腾讯表示他们已经在L...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...时间,苹果低调的在arxiv.org网站上发布论文,官宣了在多模态大模型领域的最新成果。在论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》(MM1: 多模式LLM预训练的方法、分析和见解)中可以……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...I模型。英特尔计划明年发布Gaudi 3,称Gaudi 3的性能将优于英伟达的主打AI芯片H100。由于生成式AI解决方案的需求不断增加,英特尔预计,明年,将凭借Gaudi为首的AI加速器套件占领更大份额的加速器市场。(华尔街见闻) 谷歌为...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...出现在了机器人领域。昨天晚上,朱玉可和 Jim Fan 团队(英伟达 GEAR 团队)新鲜发布了他们的最新研究成果 HOVER。这是一个仅有 1.5M 参数的神经网络,但它足以控制人形机器人执行多种机体运动。先来看看效果,将 HOVER 在不同...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...片。为了获得算力基础设施的独立性,OpenAI决定不再依赖英伟达,而是自行建立AI芯片生产线。Altman担心,随着AI技术的普及,现有的芯片供应将无法满足大规模部署的需求。他的目标是在未来几年内建成一个自给自足的半导体...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
...“爱尔名医陪伴数字人”,可支持视频、文本和语音等多模态交互,也即将投入应用。“爱科(Eyecho)”的名字既体现爱尔“创新驱动,科技爱尔”的发展战略,也起英文Echo“回音”之意,蕴含爱尔运用最新的人工智能技术,...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,蓝心小V在文本能...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...驶操作都无需人员介入。明年上千TOPS算力的车载芯片(英伟达Thor)就会问世。基于更高算力的计算平台,商汤预计绝影多模态大模型车端部署方案的首包延迟将大幅降低,推理速度进一步提高。 ……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
库克现身上海首次谈及AI话题,苹果真急了
...7万亿美元的资金,以支持公司的一项半导体计划,并与英伟达展开竞争。奥特曼在最新的访谈中对此作出回应,表示自己从未有过“要筹资7万亿美元”这类表述,只是认为“算力将成为未来的货币,将是世界上最珍贵的商品,...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...模型进行持续迭代式微调。GPT-4系列:能力跃升,增加多模态能力,最新版4o突破性价比GPT系列模型的技术演变(GPT-4~GPT-4o):继ChatGPT后,OpenAI于2023年3月发布GPT-4,它首次将GPT系列模型的输入由单一文本模态扩展到了图文双模态...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
更多关于科技的资讯:
苹果想做但没做出来!OPPO Watch X2全球首发高血压风险评估功能
快科技1月15日消息,OPPO将在2月份发布一款全新智能手表OPPO Watch X2,它将率先搭载高血压风险评估功能
2025-01-15 08:24:00
蔡磊感谢刘强东千万资助:为所有意外员工孩子托底
快科技1月15日消息,据媒体报道,蔡磊集结了15000位病友、几百位教授和团队、上百家专业科研机构和生物医药公司,更是在昔日“战友”刘强东超千万的资助下
2025-01-15 08:24:00
新生代求职有长线规划 国之重器领域最具吸引力
职场新生代表现出“长线规划”趋势。为了积累经验,提高竞争力,实习不再是大学毕业前的“最后一课”,36%的大学生从大一开始就具备了职业规划意识
2025-01-15 08:32:00
90后广西小伙娶非洲媳妇引网友热议:不要彩礼不用有车有房 纯靠爱情
1月15日消息,近日,90后广西小伙娶非洲媳妇引发网友广泛讨论。该小伙表示他们用法语沟通,在喀麦隆登记结婚,并打算给孩子上中国户口
2025-01-15 08:54:00
突发!美国证交会起诉马斯克:涉嫌证券违规 少花1.5亿美元
快科技1月15日消息,据媒体报道,当地时间1月14日,美国证券交易委员会在美华盛顿特区联邦法院对埃隆·马斯克提起诉讼,指控马斯克涉嫌证券违规
2025-01-15 08:54:00
轴距媲美标轴X5!全新国产宝马X3矿石白实车曝光:有望一季度上市
快科技1月15日消息,国产新一代宝马X3矿石白实车图曝光,预计2025年一季度上市。作为X3家族第四代车型,新一代宝马X3在华晨宝马铁西工厂下线
2025-01-15 08:54:00
浙江在线1月14日讯(通讯员 市闻 记者 李心怡)作为质量领域科技创新的重要内容,1月14日,全省数字精密测量技术研究重点实验室正式揭牌
2025-01-15 09:07:00
奥司他韦16.8/盒!胖东来卖药便宜到令人发指:于东来回应了
快科技1月15日消息,近日胖东来又开始在网上刷屏了,据说他们的医药超市中1140种药品,只加价10%,而不少网友看到药价后直呼便宜到令人发指
2025-01-15 09:24:00
湖北一女司机高速逆行30公里 被罚200元扣12分:本人直言没看标牌
1月15日消息,据国内媒体报道称,近日在S28保神高速湖北襄阳保康县段,一名女司机竟然在高速公路上逆行了30公里,过往车辆纷纷避让
2025-01-15 09:24:00
余承东秀爱车享界S9:续航很给力 上下班都是华为智驾在开
快科技1月15日消息,今天上午,华为余承东晒出了他的爱车享界S9。余承东表示,我的享界S9新车已经行驶了116公里,百公里电耗仅13
2025-01-15 09:24:00
一加Ace 5全面评测:骁龙8 Gen3+120帧原神 真香游戏直板机!
一、前言:骁龙8 Gen3极致性能新机全新的一加Ace 5已经正式登场,这是一款搭载了骁龙8 Gen3主打游戏性能的新机
2025-01-15 09:24:00
雷军立flag:2025年要学会开叉车
快科技1月15日消息,今天,小米创办人雷军发布小米汽车工厂2月份参观计划。在2月份,小米汽车工厂从初五至初七开放5场参观
2025-01-15 09:24:00
斥资134亿!TCL买下LG显示广州厂
快科技1月15日消息,据报道,TCL科技发布公告称控股子公司TCL华星,以26.15亿元的价格,获得LGDCA的20%股权
2025-01-15 09:24:00
原来的“高级水果”今年却跌下神坛:到底发生了什么
比起前两年,今年车厘子的价格简直是是断崖式下降!往年七八十块钱一斤的车厘子,今年甚至跌到了 15 元一斤,就算是 2-3J 的车厘子也就 25-35 元一斤
2025-01-15 09:24:00
不是没坏就能用!董明珠称应强制报废旧家电:格力正以旧换新
快科技1月15日消息,近日董明珠接受央视专访,其公开表示,从制造业角度讲,我们觉得“以旧换新”要形成一个很好的制度体系
2025-01-15 09:24:00