• 我的订阅
  • 头条热搜
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
... CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...DCLM来设计高质量数据集从而提高模型性能,尤其是在多模态领域。其思路很简单:使用一个标准化的框架来进行实验,包括固定的模型架构、训练代码、超参数和评估,最终找出哪种数据整理策略最适合训练出高性能的模型。...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...Demis Hassabis)在发布会上表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。据谷歌介绍,在训练后期,Gemini在各类任务上都表现优异。例如,MMLU(大规模多任务语...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...和音频并与之交互的能力。这很大程度上是设计使然:多模态在最开始就是Gemini计划的一部分。谷歌没有像OpenAI构建DALL·E(文生图模型)和Whisper(语音识别模型)那样单独训练图像和语音模型,而是从一开始就建立为一个多感...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
...”Ultra性能优于迄今最先进的人工智能模型,具有天然多模态性,显示出拥有更复杂推理能力的早期迹象。谷歌公司还表示,“双子座”能够理解、解释和生成世界上主流编程语言的代码,可以用作高级编码系统的引擎。此外“...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
全球AI大事记·疯狂三月盘点:9万亿AIGC时代即将到来|钛媒体AGI
...数十名员工已加入苹果的AI部门。苹果推出300亿参数MM1多模态大模型在一篇由多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中,苹果正式公布自家的多模态大模型研究成果。这是一个具……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...布,谷歌公司正式发布迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大...……更多
直追GPT-3.5,“欧洲版OpenAI”推出新模型,成立6个月估值20亿美元 | 最前线
...时间不长,Mistral AI的三人创始团队却相当有分量,在多模态、RAG方向上都有着丰富经验。公司CEO Arthur Mensch是前DeepMind研究科学家,主导了Chinchilla、Retro、Flamingo等重要论文的发表,而这三篇论文分别是20-22年间Google在LLM、……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...榜首,再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码...……更多
更多关于科技的资讯:
GDDR6X显存紧缺:RTX 4070换成GDDR6?
快科技7月31日消息,近日有说法称,由于美光的一批GDDR6X显存品控不达标,需要换新,直接导致RTX 4070及以上型号陷入紧缺
2024-07-31 18:03:00
正新鸡排被曝20多天不换油:涉事门店回应
7月31日消息,据媒体报道,有网友在社交平台发帖称,她在一家正新鸡排店打工时发现,这家门店存在苍蝇污染食物、烹炸用油反复使用20多天不换等卫生安全隐患
2024-07-31 18:03:00
鹦鹉爱啃主人脚嘴巴感染脚气:治疗花费400多
7月31日消息,动物会感染人类的脚气吗?答案是肯定的,近日,一只鹦鹉就因为爱啃人的脚,嘴里得了“脚气”。据悉,此事发生在上海
2024-07-31 18:03:00
上市4年把合资B级轿车干翻!全新比亚迪汉谍照曝光
快科技7月31日消息,今日,有博主曝光了一组全新比亚迪汉的路试谍照。从照片中可以看出,全新比亚迪的整体造型没有发生大的变动
2024-07-31 18:03:00
比亚迪深圳又拿了两块地:生产百万豪车仰望U9
快科技7月31日消息,比亚迪竞得深汕特别合作区两宗新能源产业用地。这两宗地将用于建设深汕比亚迪汽车工业园二期气囊、天窗
2024-07-31 18:03:00
L-H、BytePlus 和 INOVAI在东京成功举办We
7月30日,L-H(LegendaryHumanity)、字节跳动旗下BytePlus 和日本知名Web3孵化器 INOVAI 在东京联合举办Web3&
2024-07-31 18:16:00
绿色生产新视角:真空冷冻干燥机的可持续性优势
随着环保意识的日益增强,人们开始寻求更加环保、节能的生产方法。在众多生产技术中,真空冷冻干燥机因其工作原理和性能,展现出了显著的可持续性优势
2024-07-31 18:18:00
乒乓球混双赛事影院直播票房112万:人次达2.48万
快科技7月31日消息,2024年巴黎奥运会乒乓球混双决赛于7月30日上演,这场体育盛宴不仅点燃了全球观众的激情,也在影院内掀起了一股观赛热潮
2024-07-31 18:33:00
首次破百!小米汽车门店7月新增16家:8月计划新增7家
快科技7月31日消息,小米汽车目前除了需要扩充产能之外,门店数量也在加速扩张。据官方介绍,7月份共新增了16家门店,覆盖三座新城市
2024-07-31 18:33:00
理想将推送新一轮OTA升级:最高支持135km/h的自动紧急转向来了
快科技7月31日消息,理想汽车宣布即日起陆续向理想L系列和理想MEGA用户推送OTA 6.1版车机系统,本次版本升级重点围绕智能驾驶
2024-07-31 18:33:00
全红婵陈芋汐跳水夺冠 断层式第一:小米澎湃OS上线巴黎奥运会小部件
快科技7月31日消息,2024年巴黎奥运会各赛事正如火如荼地进行中,在今天进行的巴黎奥运会跳水女子双人10米台决赛中,中国选手陈芋汐/全红婵夺得金牌
2024-07-31 19:03:00
13代i7台式机仅2499元!机械革命无界M7s发布:7L小巧不占地
快科技7月31日消息,机械革命推出无界M7s台式机,搭载了第13代酷睿i7处理器,零售价只要2499元。机械革命无界M7s台式机采用了体积小巧且外观精致的机箱
2024-07-31 19:03:00
男子网购一块4.5万元手表 发现对方真发货 连忙报警
快科技7月31日消息,微信安全中心公布了一起案例,一男子网购一块4.5万元手表,发现对方真发货,连忙报警,这是怎么回事呢
2024-07-31 19:03:00
雷军第一次知道宝马BMW全名:直呼确实了不起
快科技7月31日消息,小米创办人雷军参观了宝马公司,他发微博表示,BMW百年企业,1916年创办,确实了不起,第一次知道BMW全名
2024-07-31 19:03:00
泰康HWP李爽:深度链接客户,创造无限可能
个人荣誉:上海首位HWP女企业家泰康米林家族创始人泰康五星金牌讲师MDRT百万圆桌COT会员在深度链接客户的征途中,李爽以泰康HWP的身份
2024-07-31 19:17:00