• 我的订阅
  • 头条热搜
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
... CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...Demis Hassabis)在发布会上表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。据谷歌介绍,在训练后期,Gemini在各类任务上都表现优异。例如,MMLU(大规模多任务语...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...和音频并与之交互的能力。这很大程度上是设计使然:多模态在最开始就是Gemini计划的一部分。谷歌没有像OpenAI构建DALL·E(文生图模型)和Whisper(语音识别模型)那样单独训练图像和语音模型,而是从一开始就建立为一个多感...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
...”Ultra性能优于迄今最先进的人工智能模型,具有天然多模态性,显示出拥有更复杂推理能力的早期迹象。谷歌公司还表示,“双子座”能够理解、解释和生成世界上主流编程语言的代码,可以用作高级编码系统的引擎。此外“...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
全球AI大事记·疯狂三月盘点:9万亿AIGC时代即将到来|钛媒体AGI
...数十名员工已加入苹果的AI部门。苹果推出300亿参数MM1多模态大模型在一篇由多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中,苹果正式公布自家的多模态大模型研究成果。这是一个具……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...布,谷歌公司正式发布迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大...……更多
直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线
...时间不长,Mistral AI的三人创始团队却相当有分量,在多模态、RAG方向上都有着丰富经验。公司CEO Arthur Mensch是前DeepMind研究科学家,主导了Chinchilla、Retro、Flamingo等重要论文的发表,而这三篇论文分别是20-22年间Google在LLM、……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...榜首,再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
随着语言模型的能力越来越强,现有的这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
更多关于科技的资讯:
大疆无人机拆开一看,80%芯片源自海外!大疆会步华为后尘吗?
大疆无人机与华为手机一样,已跻身"国货之光"行列,但其快速崛起引发了国际间的嫉妒和戒备。日本通过拆解大疆无人机,揭示了80%芯片源自海外的事实
2024-07-17 17:00:00
分钟级更新!高德首发实时积水地图
近日,多地暴雨频发,容易给出行带来瞬时影响。为此高德地图基于大模型算法,升级积水地图功能,推出“实时积水地图”,可实现道路积水点分钟级更新
2024-07-17 17:48:00
PLC如何远程控制路灯?
PLC(可编程逻辑控制器)远程控制路灯的过程涉及多个环节和组件的协同工作。以下是PLC远程控制路灯的主要步骤和关键点:一
2024-07-17 18:01:00
爱聊APP用科技筑牢安全防线,让社交更无忧
在数字化时代,社交平台已成为人们日常生活中不可或缺的一部分,尤其是对于那些寻求爱情与友谊的单身男女而言,社交平台不仅是他们追求爱情
2024-07-17 18:01:00
2024年AI手机出货量将达2.34亿部,同比暴涨364%!
7月16日消息,市场研调机构IDC近日发布的最新报告指出,随着生成式人工智能(Gen AI)开始盛行,让沉寂已久的智能手机市场充满新动能
2024-07-17 18:02:00
从9块9卖到500,手机壳有多暴利?
作者|詹方歌‍‍编辑|邢昀‍2010年,正值诺基亚时代的尾声,诸多手机厂商对智能机跃跃欲试,但迟迟没能拿出足够好的产品方案
2024-07-17 18:02:00
小米首款小折叠屏手机已规划五年、内部设计多种形态
IT之家 7 月 17 日消息,小米首款小折叠屏手机 MIX Flip 今日已公开亮相,配备“全尺寸多功能大外屏”,将于 7 月 19 日正式发布
2024-07-17 18:02:00
刷新全球最快内存,旗舰手机顶级满血新标准来了
进入下半年,有关新一代旗舰SoC的消息越来越多,近日三星半导体官方宣布,速度高达10.7Gbps的LPDDR5X DRAM已在联发科下一代旗舰移动平台(天玑9400)上完成验证
2024-07-17 18:03:00
复亚智能无人机智慧城市,数字时代的城市进化新引擎
在数字化浪潮的推动下,智慧城市的概念已经成为城市管理和服务创新的代名词。"无人机智慧城市"作为这一进程中的重要一环,正在以其独特的技术优势
2024-07-17 18:05:00
星火大模型最新成果亮相青岛,开启行业新篇章
为广泛赋能生态合作伙伴,7月16日科大讯飞产业加速中心成功举办讯飞星火讯链营暨AI TechDay青岛站活动,本次活动聚焦讯飞星火大模型最新技术成果
2024-07-17 18:05:00
平行宇宙中的另一个你,也许正过着你最想要的生活
大家有时候有没有感觉到某一个场景相当熟悉?有时候甚至知道接下来要发生的事情?而接下来要发生的事情刚好也正是自己在之前感受到的
2024-07-17 18:06:00
国际空间站“分家”提前?美俄还在计划时,中国的将升级到六舱位
国际空间站要提前分家了?早在2022年,俄罗斯就曾经公开表示,要计划在2024年建设自己的空间站。虽然美国一再强调大家要继续合作到2030年
2024-07-17 18:06:00
“音乐节+旅游”激发贵州文旅夏日消费热潮
多彩贵州网讯(本网记者 李钰)“如果要去一处人越多越开心的地方,那一定是音乐节!”在贵州,贵阳泡泡岛音乐、Z纪元音乐节
2024-07-17 16:37:00
第六届iSEE全球美味奖公布,百草味智利西梅干探索健康新风尚
近日,备受关注的第六届iSEE全球奖正式揭晓。经过iSEE评审委员会的评审,百草味阳光果派智利去核西梅干在全球4000+案例参选的激烈评选中脱颖而出
2024-07-17 16:46:00
浙江:拓展消费新场景 打造年营收超万亿元大视听产业
消费日报网讯(记者牛夏风)近日,浙江省政府办公厅印发《关于加快推进大视听产业高质量发展的实施意见》(以下简称《实施意见》)
2024-07-17 16:47:00