• 我的订阅
  • 头条热搜
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...”是很难进步的。不妨和我们一起,认真给GPT-4o算笔账。全能模型,究竟“惊艳”在哪里?谷歌反击OpenAI的发布会,被称为“腹泻式更新”,一口气推出了十来款新品及升级。之所以让人看到睡着,是因为大家已经在前一天被GPT...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
最有希望超越GPT-4的模型来了——美国硅谷时间12月6日上午,谷歌CEO劈柴正式宣布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMin...……更多
...、音频和图像的任意组合进行输出,其中“o”代表“omni全能”。一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。模态即每一种信息...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...发推出AI多模态训推融合一体机,为客户提供训推融合的全能型算力。这款一体机广泛适配主流大模型,支持多模态内容输出,为客户提供便捷的模型应用构建环境。 推理一体机:该款一体机聚焦于为客户提供高性能全场景推...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GPT-4o的“o”取自Omni(全能),它充分展示了OpenAI在人工智能领域的雄厚实力。该模型在平均320毫秒(最快232毫秒)的时间内响应音频输入,...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...入了“Her 时代”。GPT-4o的“o”代表“omni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CE...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...义大模型全套能力集于一身,致力于成为“通情达义”的全能AI助手。坚定开源路线,成为中国最强开源大模型去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款...……更多
华中科技大学白翔教授发布多模态大模型
...技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可以同时...……更多
网易有道周枫:AI PC将是工作、学习、生活的个人全能助理
...网易有道CEO周枫表示,AI PC将是工作、学习、生活的个人全能助理,期待“子曰”教育大模型能与联想即将推出的AI PC适配,为消费者提供更智能的本地学习体验,实现AI普惠率先在教育行业落地。(网易执行副总裁、网易有道CEO...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...用户需求。3、专项Agent训练,应对复杂需求能力更强:更全能大模型时代,AI Agent(智能体)已经成为大模型技术的主流落地方向。“天工3.0”针对模型独立规划、调用、组合外部工具及信息的能力进行了专项训练,使其能够独立...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了一个全...……更多
...港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等多模态...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
7月26日,智谱AI CEO张鹏在智谱Open Day上宣布,AI生成视频模型清影(Ying)正式上线智谱清言。南都记者关注到,应用清影生成6秒视频只需要30秒的时间,该功能不仅支持文生视频、图生视频,也支持视频生成视频(以下是利用网...……更多
...院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶,从而...……更多
...但很可能永远都达不到;有专家认为,大家对大数据和大模型关注度太高了,现在的人形机器人应该更多关注机器人本体。而关于具身智能,身为北京大学计算机学院前沿计算研究中心(CFCS)助理教授、博士生导师,同时又是...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...创新工场董事长、零一万物CEO李开复出席2024澜舟科技大模型技术和产品发布会,并发表《AI2.0平台变革进行式》主题演讲,对AI未来的发展趋势进行了展望。李开复表示,纯移动应用将成为过去式,未来生成式AI应用将占据主导...……更多
...报。浪潮通信信息参与的“算力网络下基于大模型技术的全能秘书应用”项目、“低碳算力调度及融合应用系统”项目荣获全国总决赛一、二等奖,为“泛在互联、AI赋能”时代背景下,面向多模态、多场景、多行业,提供“算...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模型间展现出强大的可迁移性。多模态对比学习(如CLIP)...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标超越 GPT-4V 水平。更有多项功能首次上「端」:小钢炮...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...系统将面向大众创作者开放,并与鹦鹉人APP配套,成为UGC全能创作工具系统,进一步丰富AI泛娱乐应用矩阵的内容生态和用户体验。丝芭传媒还计划进一步扩大AI大模型落地应用的范围,其生态系统中将陆续加入基于AI和UGC融合的...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
...性等方面具备惊人效果……近日,OpenAI发布的文生视频大模型Sora迅速引发人们关注。业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领...……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...大厂支出指引AIcapex占比继续提升,国内受政策驱动及大模型参数对标海外升级,全球智能算力预计维持高景气,未来5年中国智能算力规模CAGR预计52.3%。主线二,数据侧:数据要素三次价值释放元年,会计入表推动数据价值“显...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
支付宝多模态医疗大模型正式亮相
在2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
更多关于科技的资讯:
专访复旦大学教授沈涵:打造“城市级剧本游”,发动“全民共创”
齐鲁晚报•齐鲁壹点 高雅洁 李潇10月22日,“数智文旅 媒动山海”城市文旅品牌建设交流会在青岛举行。复旦大学旅游学系教授
2025-10-22 20:32:00
10月21日小店政务发布信息,小店区审批局积极推进“开办便利店一件事”集成服务改革,通过流程再造、帮办代办服务、市场需求调研等
2025-10-22 18:56:00
10月22日从中北高新区获悉,该区企业山西天成半导体材料有限公司继今年成功研制12英寸导电型碳化硅单晶材料后,依托自主研发设备再度攻克12英寸高纯半绝缘碳化硅单晶材料技术难关
2025-10-22 18:56:00
亚太森博装备技术创新中心正式投入使用
随着日照市“亚太森博杯”浆纸产业链职工职业技能大赛的盛大启幕,公司装备技术创新中心同步正式启用。创新中心充分整合多方资源
2025-10-22 19:21:00
山东外国语职业技术大学教授入选“全球前2%顶尖科学家”榜单
近日,美国斯坦福大学联合爱思唯尔数据库(Elsevier Data Repository)发布了《全球前2%顶尖科学家榜单(World's Top 2% Scientists)》
2025-10-22 19:23:00
富士康储能项目量产,致力于打造全球首个“储能灯塔工厂”
大河网讯 预计年均省电超千万元,年产能将达到3GWh的规模……富士康旗下储能品牌“富储科能”近日在郑州航空港举行富士康储能量产暨新品发布会
2025-10-22 19:27:00
华为鸿蒙操作系统 6 正式发布!余承东评论区被“催产”mate80
华为鸿蒙6.0系统正式版于今日(10月22日)发布,Mate 80系列预计将首发搭载。鸿蒙6.0系统以更好看、更好用、更智能
2025-10-22 15:56:00
视源股份肖航:“中国制造”正成为传递创新、可靠与高品质的“新名片”
肖航接受人民日报海外网采访“通过建立深度本地化的运营与服务团队,我们的MAXHUB已成功在全球超过140个国家和地区提供服务
2025-10-22 14:05:00
中国消费名品全国行(河北站)“清河羊绒”供需对接活动举办供需双向奔赴 品牌加速出圈10月21日,中国消费名品全国行(河北站)“清河羊绒”供需对接活动在邢台市清河县举办
2025-10-22 08:10:00
雄安建设者拍雄安|你好,雄安图书馆!
9月26日拍摄的雄安图书馆。9月27日,雄安图书馆少儿阅览区,图书管理员带着小读者通过智能书架挑选图书。拍摄者:齐劲青 中建八局(北京)建设投资有限公司市场部业务经理拍摄时间
2025-10-22 08:19:00
五年千亿研发淬炼,小米携手粤港澳大湾区共筑“同心圆”
10月15日,以“同心湾区,论道未来”为主题的2025粤港澳大湾区人工智能技术发展论坛在珠海美高梅华府酒店隆重举行。本次论坛由珠海市委统一战线工作部指导
2025-10-22 08:30:00
鞍矿爆破“露天矿山智能爆破关键技术研究与应用”项目入选“中国好技术”项目库
近日,由中国生产力促进中心协会联合全国各级生产力促进中心、行业协会及专业机构共同发起的2024年度“中国好技术”评选正式落下帷幕
2025-10-22 08:30:00
厦门网讯(厦门日报记者 李晓平)机器人赛道正吸引越来越多厦企参与。20日,联合星辰(厦门)科技有限公司(以下简称“联合星辰”)
2025-10-22 08:57:00
从场景破题 大力推进福建省(厦门)人工智能产业园建设
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏) 走进厦门软件园,你会发现“人工智能 +”的创新应用图景正徐徐展开
2025-10-22 08:57:00
《全国中老年艺术等级考评规范》团体标准深圳秘书处挂牌
日前,《全国中老年艺术等级考评规范》团体标准深圳秘书处在十方融海梨花教育办公区正式挂牌。当前,我国人口老龄化程度持续加深
2025-10-22 09:05:00