• 我的订阅
  • 头条热搜
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...”是很难进步的。不妨和我们一起,认真给GPT-4o算笔账。全能模型,究竟“惊艳”在哪里?谷歌反击OpenAI的发布会,被称为“腹泻式更新”,一口气推出了十来款新品及升级。之所以让人看到睡着,是因为大家已经在前一天被GPT...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
最有希望超越GPT-4的模型来了——美国硅谷时间12月6日上午,谷歌CEO劈柴正式宣布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMin...……更多
...、音频和图像的任意组合进行输出,其中“o”代表“omni全能”。一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。模态即每一种信息...……更多
吴泳铭官宣3800亿投入后,阿里云如何打AI这场硬仗?
...云认为单一的文本模型已经难以满足市场需求,必须发展全能模型。“客户今天越来越希望要的是全模态的模型,今天的模型很聪明,但如果是聋子、哑巴,在很多交互场景就不行。”常常跟客户打交道的徐栋,观察到了客户需...……更多
...为一种思维上的怠惰。就人类而言,并不存在一位“全知全能”的神人,而恰恰相反,人类社会多数情况下是在各专业领域进行分工与专精,这才是普遍现象。 对于AI而言,这种思路其实也更适合现阶段将AI的数据处理能力应用...……更多
全球顶尖人工智能科学家加盟 阿里AI To C业务布局再提速
...里AI To C代表产品,夸克近期升级品牌Slogan—“2亿人的AI全能助手”。据内部人士透露,许教授将专注于AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案,大大提升阿里巴巴AI应用C端产品在模型结合应用的端对端...……更多
微软推出全能型人工智能模型 Kosmos-1
...用户感受到了AI的强大,而微软于近日推出了更为强悍的全能型AI--Kosmos-1。ChatGPT是纯文本LLM,而它是更强大的多模式大型语言模型(MLLM)。Kosmos-1可以分析图像的内容、解决视觉难题、执行视觉文本识别、通过视觉智商测试以及...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...发推出AI多模态训推融合一体机,为客户提供训推融合的全能型算力。这款一体机广泛适配主流大模型,支持多模态内容输出,为客户提供便捷的模型应用构建环境。 推理一体机:该款一体机聚焦于为客户提供高性能全场景推...……更多
OpenAI推出GPT5模型引爆AI竞赛,微软/谷歌/微美全息加码千亿市场竞逐AGI
...GPT-4发布于2023年3月,虽然去年OpenAI先后发布了GPT-4o(o代表全能)和GPT-4o mini(轻量版),但依然是基于GPT-4的增强版和简化版。如今,奥特曼称GPT-5是 “世界上最出色的模型”,向人工智能(AGI)道路上迈出了“重要一步”。那么就拭目...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GPT-4o的“o”取自Omni(全能),它充分展示了OpenAI在人工智能领域的雄厚实力。该模型在平均320毫秒(最快232毫秒)的时间内响应音频输入,...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...内部分享中,奇绩创坛创始人陆奇直言:他已经跟不上大模型时代的“狂飙”速度了。在ChatGPT引发的现象级讨论下,千亿级大模型的军备竞赛愈演愈烈,不少企业赶趟儿式的交出了自家的大模型答卷。尽管大模型的质量参差不...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...入了“Her 时代”。GPT-4o的“o”代表“omni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CE...……更多
全球首个全模态大模型紫东太初2.0发布,中科院王金桥:希望实现更类人的智能
...的最新进展。会上,基于昇思AI框架的全球首个全模态大模型“紫东.太初2.0”正式发布,支持多轮问答、文本创作、图像生成、3D理解、信号分析等跨模态任务。“我们的初心就是希望机器实现更类人的智能。”中科院自动化所...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...义大模型全套能力集于一身,致力于成为“通情达义”的全能AI助手。坚定开源路线,成为中国最强开源大模型去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款...……更多
华中科技大学白翔教授发布多模态大模型
...技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可以同时...……更多
网易有道周枫:AI PC将是工作、学习、生活的个人全能助理
...网易有道CEO周枫表示,AI PC将是工作、学习、生活的个人全能助理,期待“子曰”教育大模型能与联想即将推出的AI PC适配,为消费者提供更智能的本地学习体验,实现AI普惠率先在教育行业落地。(网易执行副总裁、网易有道CEO...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...用户需求。3、专项Agent训练,应对复杂需求能力更强:更全能大模型时代,AI Agent(智能体)已经成为大模型技术的主流落地方向。“天工3.0”针对模型独立规划、调用、组合外部工具及信息的能力进行了专项训练,使其能够独立...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了一个全...……更多
...港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等多模态...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
Manus和DeepSeek的差别是什么 谁更厉害:一文秒懂!
...论如下:DeepSeek是知识型“最强大脑”,Manus是执行型“全能打工人”,两者并非直接竞争,而是技术路径的互补。一、技术定位与核心能力DeepSeek:知识型“最强大脑”技术架构:基于混合专家模型(MoE),参数规模达6710亿,...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
7月26日,智谱AI CEO张鹏在智谱Open Day上宣布,AI生成视频模型清影(Ying)正式上线智谱清言。南都记者关注到,应用清影生成6秒视频只需要30秒的时间,该功能不仅支持文生视频、图生视频,也支持视频生成视频(以下是利用网...……更多
...近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上的潜力。...……更多
...金。资金主要将用于核心研发团队的建设,加速多模态大模型和应用产品的研发。成立于2023年3月,生数科技由安全可控人工智能方案提供商瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化,聚焦于多模态生成式大模型与应用产...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...璟发表主题演讲《迎接视觉领域的GPT-4时刻》,分享了大模型技术和应用层面的思考。他表示,今年以来大模型厂商密集的模型发布,意味着追求智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要...……更多
...院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶,从而...……更多
...但很可能永远都达不到;有专家认为,大家对大数据和大模型关注度太高了,现在的人形机器人应该更多关注机器人本体。而关于具身智能,身为北京大学计算机学院前沿计算研究中心(CFCS)助理教授、博士生导师,同时又是...……更多
更多关于科技的资讯:
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00
2025教室节能照明标杆盘点 四大品牌绿色护眼解决方案解析
在“双碳”目标引领下,校园节能改造成为教育领域绿色发展的重要方向。据住建部统计,商业建筑能耗中照明系统占比高达35%,学校作为人员密集
2025-12-06 16:09:00
海尔智慧家电亮相迪拜
11月26日至28日,中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中,海尔智家针对当地高温、多尘等特点,集中展示了洗衣机
2025-12-06 16:10:00
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础,与手机厂商在操作系统层面合作开发的AI助手软件
2025-12-06 17:41:00
文化中国行|全场听觉无死角 吉林省音乐厅声学揭秘
历经修缮重生的丰乐剧场,以“吉林省音乐厅”之名即将绽放春城。这座历史建筑,从伪满时期影剧院到音乐剧场的跨越,背后藏着一套极致考究的声学设计方案
2025-12-06 18:41:00
伊贝格:让机床行业不再为“头”烦恼
“关键核心技术与高端装备对外依存度高”一直是制约制造业升级的瓶颈。五轴联动铣头作为五轴机床的核心功能部件,过去很长一段时间被欧洲部分知名厂商垄断
2025-12-06 22:07:00
山东重工潍柴集团2026年商务大会圆满召开
鲁网12月6日讯12月6日,以“乘势向上 聚力向新”为主题的山东重工潍柴集团2026年商务大会在潍坊举行。山东重工集团党委书记
2025-12-06 22:43:00