• 我的订阅
  • 头条热搜
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
金磊 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI传闻中的谷歌杀手锏Gemini,来了!就在刚刚,谷歌CEO皮猜和哈萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商量多模...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品,也是...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-mo...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
...中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地理学全谱系高质...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言画”全方位...……更多
支付宝多模态医疗大模型正式亮相
在2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-7...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...即理解人们思维的能力,是开发具有类人社会智能的 AI 模型的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比,雄心勃勃地宣布进入“Gemini时代”,更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
智东西6月3日消息,大模型“套壳”的回旋镖,这次扎到了美国科研团队身上。最近几天,斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生图”四大核心功...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...大厂支出指引AIcapex占比继续提升,国内受政策驱动及大模型参数对标海外升级,全球智能算力预计维持高景气,未来5年中国智能算力规模CAGR预计52.3%。主线二,数据侧:数据要素三次价值释放元年,会计入表推动数据价值“显...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
更多关于科技的资讯:
年轻人急着找工作,BOSS直聘偷偷赚翻了
本文经授权转载自盐财经(ID:nfc-yancaijing)原标题 | 工作找不到,BOSS直聘却赚翻了文 | 任早羽编辑 | 何子维视觉 | 诺言急于求职的年轻人躺不平
2024-10-21 04:40:00
今年三季度,泰安受理投诉举报22450件,挽回经济损失117万元
泰安市市场监督管理局于10月14日公布了2024年第三季度受理投诉举报情况,三季度,全市市场监管系统共受理处置各类投诉举报咨询22450件
2024-10-20 22:43:00
1890元!小米13双11大降,骁龙8G2旗舰真香!
虽然小米13是2022年发布的,但至今仍备受关注,很多人询问是否值得购买。这充分体现了它的热度。骁龙8G2机型性价比高查询后发现小米13的12+256版本价格约2600元
2024-10-20 18:46:00
为何新款旗舰手机越来越不受欢迎了?
手机行业以往推崇“买新不买旧”,但现在趋势似乎反转了,很多人转而购买旧款旗舰,即便新款有各种优惠和赠品。身边的朋友在购机时也更倾向于选择老款旗舰
2024-10-20 18:46:00
英特尔联手AMD!反击苹果高通,合作谋变
本来以为这金秋十月,应该是国产手机厂商们的天下。小米、OPPO、华为、荣耀、一加和真我这些厂家都憋着劲儿要发布新款旗舰机呢
2024-10-20 18:46:00
真我GT7 Pro开启1元预约!
10月以来,各大厂商都陆续发布旗舰新机,近日又有一款国产高端旗舰开启预约,那就是号称新一代双擎旗舰的真我GT7Pro,官方称真我GT7Pro坚持“骁龙顶级旗舰芯+潜望长焦”的产品定义
2024-10-20 18:46:00
OPPO Find X8打破现状,谁说影像旗舰不能轻薄
这两天的数码圈可太热闹了,各厂商旗舰新机纷纷登场,例如定档10月24日发布的OPPOFindX8系列便吸引了众多网友关注
2024-10-20 18:47:00
沉淀五天涨粉百万后复播!听泉鉴宝竟然带了“大开门”宝贝?
半年涨粉2000万,停播五天又涨粉百万,还频频霸榜热搜的“听泉鉴宝”终于又“开门”了。10月15日晚,网红博主“听泉鉴宝”正式复播
2024-10-20 18:48:00
OPPO 磁吸能量卡移动电源预热
IT之家10月20日消息,OPPOFindX8系列及旗舰生态新品发布会将于10月24日举行,官方今日对磁吸移动电源“磁吸能量卡”进行预热
2024-10-20 18:48:00
蜂王电竞“27QHPRO”显示器预售
IT之家10月19日消息,蜂王电竞“27QHPRO”显示器现已在京东平台开启预售,搭载27英寸2KFastIPS屏,10月22日20:00支付尾款
2024-10-20 18:48:00
玩家称 Switch 更新 19.0.0 版固件后出问题
IT之家10月20日消息,任天堂日前为Switch推送了最新的19.0.0版本固件更新。然而一些用户在Reddit论坛上反映
2024-10-20 18:48:00
盛色推出“D73uPro”27 英寸显示器
IT之家10月20日消息,盛色今天在京东上架一款“D73uPro”27英寸显示器,这款显示器主打“4K160Hz/FHD320Hz”双模显示
2024-10-20 18:49:00
微软警告:部分华硕设备与Win11 24H2存在兼容性问题
IT之家10月20日消息,微软称,部分华硕笔记本电脑存在与Windows1124H2版本不兼容的问题,决定暂时停止向这些设备推送更新
2024-10-20 18:49:00
HORI 推出《太鼓达人》专用控制器
IT之家10月20日消息,HORI今天推出新款索尼授权《太鼓达人》专用游戏控制器“太鼓”,这款“太鼓”支持PS5/PS4/PC使用
2024-10-20 18:49:00
荣耀手表 5 智能手表现身海外官网
IT之家10月20日消息,荣耀手表5已官宣将于10月30日的荣耀Magic7系列旗舰新品发布会上正式登场,手表将沿用前代的方形设计
2024-10-20 18:50:00