• 我的订阅
  • 科技

智谱开源GLM-PC 基座模型CogAgent-9B,让 AI 智能体“看懂”屏幕

类别:科技 发布时间:2024-12-27 09:20:00 来源:IT之家

IT之家 12 月 27 日消息,智谱技术团队公众号昨日(12 月 26 日)发布博文,宣布开源 GLM-PC 的基座模型 CogAgent-9B-20241220,基于 GLM-4V-9B 训练,专用于智能体(Agent)任务。

IT之家注:该模型仅需屏幕截图作为输入(无需 HTML 等文本表征),便能根据用户指定的任意任务,结合历史操作,预测下一步的 GUI 操作。

得益于屏幕截图和 GUI 操作的普适性,CogAgent 可广泛应用于各类基于 GUI 交互的场景,如个人电脑、手机、车机设备等。

智谱开源GLM-PC 基座模型CogAgent-9B,让 AI 智能体“看懂”屏幕

相较于 2023 年 12 月开源的第一版 CogAgent 模型,CogAgent-9B-20241220 在 GUI 感知、推理预测准确性、动作空间完善性、任务普适性和泛化性等方面均实现了显著提升,并支持中英文双语的屏幕截图和语言交互。

CogAgent 的输入仅包含三部分:用户的自然语言指令、已执行历史动作记录和 GUI 截图,无需任何文本形式表征的布局信息或附加元素标签(set of marks)信息。

智谱开源GLM-PC 基座模型CogAgent-9B,让 AI 智能体“看懂”屏幕

其输出涵盖以下四个方面:

思考过程(Status & Plan): CogAgent 显式输出理解 GUI 截图和决定下一步操作的思考过程,包括状态(Status)和计划(Plan)两部分,输出内容可通过参数控制。

下一步动作的自然语言描述(Action):自然语言形式的动作描述将被加入历史操作记录,便于模型理解已执行的动作步骤。

下一步动作的结构化描述(Grounded Operation): CogAgent 以类似函数调用的形式,结构化地描述下一步操作及其参数,便于端侧应用解析并执行模型输出。其动作空间包含 GUI 操作(基础动作,如左键单击、文本输入等)和拟人行为(高级动作,如应用启动、调用语言模型等)两类。

下一步动作的敏感性判断:动作分为“一般操作”和“敏感操作”两类,后者指可能带来难以挽回后果的动作,例如在“发送邮件”任务中点击“发送”按钮。

CogAgent-9B-20241220 在 Screenspot、OmniAct、CogAgentBench-basic-cn 和 OSWorld 等数据集上进行了测试,并与 GPT-4o-20240806、Claude-3.5-Sonnet、Qwen2-VL、ShowUI、SeeClick 等模型进行了比较。

智谱开源GLM-PC 基座模型CogAgent-9B,让 AI 智能体“看懂”屏幕

结果显示,CogAgent 在多个数据集上取得了领先的结果,证明了其在 GUI Agent 领域强大的性能。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-27 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

蚂蚁集团开源“灵波”四款模型,开启具身智能基座开源新时代,海外开发者反响热烈
...的四款核心模型,构筑起一套开源且完整的具身智能开发基座。此举不仅在海外引发技术社区与技术媒体的广泛关注,更被认为是以“开源开放”模式,撬动物理AI发展的重要尝试。开源全家福:
2026-01-30 16:30:00
蜜度CTO刘益东:AI技术发展的成果要让普通人都能理解 | 最前线
...厂商跳脱出Transformer的框架,去做创新。发布自研的行业基座大模型,是今年蜜度的目标。刘益东觉得,自研行业基座大模型是蜜度的方向:“下一个创造风口的可能就不是Open
2023-07-13 14:00:00
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...在6月26日启动技术测试,其核心产品——图形化智能社交基座美踏元宇宙也即将开放首轮用户内测。官方信息显示,鹦鹉人和美踏元宇宙是丝芭传媒AI技术应用产品矩阵中,率先进入内测阶段
2024-06-25 20:51:00
昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局
...创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1
2025-02-18 11:13:00
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智能实验室在榜单发布同时表示
2024-02-04 14:00:00
「实在智能」完成近2亿元C轮融资,推出基于自研大模型的Agent智能体 | 36氪首发
...。出于B端客户数据安全保护的需求,实在智能选择自研基座大模型。2023年8月16日,公司发布“塔斯”(TARS)垂直大语言模型
2023-12-18 18:53:00
萤石多款智能家居新品发布,引入AI大模型及类汽车三电系统
...食物地方),产品共有两个版本,其中旗舰版内置了充电基座,没电可以自动回到基座充电,并且附赠逗猫棒,而标准版则是简易收纳基座
2024-04-07 15:41:00
成研院联合中储粮成都储藏研究院发布“网上问粮”语言基座大模型
...究院成功发布“黍稷”储粮大模型——“网上问粮”语言基座大模型。中国移动(成都)产业研究院副总经理赵艳琦出席大会并参与发布仪式。“网上问粮”语言基座大模型以AI大模型前沿科技为
2024-11-09 14:17:00
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...在已具备强大能力的开源基础模型之上。▌通义模型的“基座”作用根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其
2025-02-07 06:25:00
更多关于科技的资讯:
长白时评评论员 丁铁巴基斯坦独立新闻社日前报道,曾是大型农场专属的现代农业机械化,正因中国农机驶入全球田间地头被改写,手工耕作的辛劳正被高效的机械作业替代
2026-03-11 11:32:00
降噪新科技,轻松听清晰,潜能发展更可期----科利耳Nucleus™ 8以创新聆听赋能成长
在移动互联高度发达的当下,听损人士的生活场景愈发多元:孩子们在游乐场嬉戏,笑声与广播声交织;学生们在校园里讨论,声音此起彼伏
2026-03-11 13:01:00
海湾深化转型,打造第二增长曲线
2025年,海湾安全技术有限公司(以下简称"海湾")迈入发展新阶段,在消防行业深度变革的浪潮中交出了一份亮眼的答卷。新年伊始
2026-03-11 13:02:00
八马以科技为翼,武夷山超级工厂破解茶行业非标发展桎梏
中国茶行业千年发展,却长期受困于“非标”痛点,品质参差、产能有限成为行业升级的最大阻碍。而作为“高端中国茶第一股”的八马茶业
2026-03-11 13:04:00
实现社保一站式便民服务厦门“汇智办”让缴费人“会自办”东南网3月11日讯(海峡导报记者 孙春燕 通讯员 杨楠欢 叶璐璐 廖皓宇) 受春节过后的“返工潮”影响
2026-03-11 13:46:00
探路制造出海“关键一跃”:华南师范大学调研团队走进华翱集团
面对复杂多变的国际环境,佛山制造业正迎来新一轮深度转型的关键期。从深耕国内市场到逐鹿全球蓝海,如何实现从单一“产品出海”向涵盖“技术-制造-品牌”的全链条出海跨越
2026-03-11 13:04:00
近日,山西交控养护集团传来捷报,其自主研发的“晋路养”系列智能交安设施——4G车载防闯入预警系统成功荣获国家实用新型专利
2026-03-11 08:16:00
聚力共腾丨用空气创造答案,2026大金空调全国经销商年会成功召开
3月7日,“聚力共腾——2026大金空调全国经销商年会”在上海西岸国际会展中心重磅召开。来自全国超1400家优秀经销商代表与大金研发
2026-03-11 08:17:00
白马湖畔小巴士 自动驾驶免费乘
近日,三辆自动驾驶的小型巴士在滨江白马湖区域投入运营,乘客不用刷卡、无需投币,就可免费乘坐。运营的自动驾驶小巴士拥有360度无死角的感知能力
2026-03-11 08:22:00
“296X”核心区能级不断提升杭州日报讯 借助机器人,医生在术前可通过CT影像生成三维模型,并利用AI自动识别病灶,完成假体选型与手术路径设计
2026-03-11 08:22:00
厦门网讯(厦门日报记者 王元晖)我市又有一批企业脱颖而出。工信部、国家药监局近日联合公布了生物医用材料创新任务和人工智能医疗器械创新任务两份“揭榜挂帅”入围名单
2026-03-11 08:34:00
厦门网讯 (厦门日报记者 房舒)近日,一款名为OpenClaw(网友俗称“龙虾”)的开源AI智能体受到广泛关注,在厦门掀起一股安装使用热潮
2026-03-11 08:34:00
厦门网讯 (厦门日报记者 林露虹)开春以来,厦门企业融资捷报频传,涵盖新型显示、半导体、商业航天等硬科技领域。资金的注入不仅为企业技术迭代和市场拓展按下“加速键”
2026-03-11 08:35:00
2026年聊城市消费补贴有多方面调整!
鲁网3月10日讯(记者 泮晓阳)3月10日上午,聊城市政府新闻办公室召开聊城市优化消费环境主题新闻发布会,记者在会上获悉
2026-03-11 10:03:00
共筑蛋白营养新标准!纽特舒玛与全球优质蛋白原料商Actus达成战略合作
近日,青岛百洋医药股份有限公司旗下蛋白营养专家品牌纽特舒玛(Nutrasumma)与全球知名的蛋白质生产及深加工企业Actus Nutrition(简称Actus)正式确立战略供应合作关系
2026-03-11 10:30:00