• 我的订阅
  • 科技

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

类别:科技 发布时间:2024-10-23 14:27:00 来源:搜狐科技

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

出品|搜狐科技

作者|郑松毅

OpenAI的劲敌,甩了“大招”!

就在几个小时前,Anthropic AI发布了升级版模型Claude 3.5 Sonnet,以及新模型Claude 3.5 Haiku。

但最吸引人的是,Anthropic AI这次推出了一项处于测试阶段的新功能——AI操作计算机能力(Computer Use)。

网友直呼,“像魔术,AI Agent真的来了。”

AI自己“玩”电脑

这项能力的亮相,似乎又把AI大模型“卷”到了新高度。

之前各大厂商为了提升模型逻辑推理能力,可谓是下了不少功夫。但在“执行”和“操作”能力方面,一直还是饱受吐槽的点,也因此很多人认为大模型距离成为真正的“智能体”还有很大差距。

但现在,可以像人类一样使用计算机的AI,来了。

在Anthropic的演示中,AI可以根据人类指令查看屏幕、移动光标、点击操作、搜索和键入信息。

与此前常见的AI功能不同,用户只需要给定一个任务目标,AI可以一气呵成完成所有操作,全程不再需要任何的人类参与。

比如现在你需要填写一张供应商表格信息,所需数据需要从一份有数千行数据的Excel表格中一一对应查找,先不说要花上多长时间,最可怕的是,找了半天表里还没有你想要的数据。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

现在,你只需要跟AI说一声,它就会从查看屏幕开始,从表里查找匹配的信息并填入相应的目标栏中。如果不幸手中的表里没有目标数据,它会自己上网浏览查询,自动点击切换页面,最终把目标信息填入。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

同样,编写代码对它来说也是不在话下。

当你跟它说想做一个“90年代设计风格”的网站后,它会很快完成代码编写任务。

值得一提的是,你还可以让它把代码文件下载到本地并运行,如果发现你在本地未安装配置Python(代码运行软件),它会自动下载修复报错,省去手动安装的麻烦。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

虽然听起来让人充满期待,但现实是,目前该功能测试漏洞百出,Anthropic正在尽力查缺补漏。

一名内部测试人员介绍,“在一次编码测试中,Claude在中途停了下来,打开了黄石国家公园的图片,接着展开了一系列迷之操作。”

Anthropic表示,为了给用户提供更好的使用体验,目前该功能仅支持开发者通过API配置和调用,想用的小伙伴们还需耐心等一等。

Claude模型升级,数学能力反超OpenAI

看完新功能展示,再来看看本次Claude 3.5系列模型升级变化。

从官方给出的测试数据来看,对比上一代Claude 3.5 Sonnet,升级版模型在逻辑、编程、数学等方面都有明显能力提升。

特别是在数学方面,原本落后于劲敌OpenAI的模型GPT-4o,但这次升级后实现了反超。现在可以说,Claude 3.5 Sonnet是全面“吊打”GPT-4o了。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

全新模型Claude 3.5 Haiku主打的是性价比和响应速度,在与Claude 3 Haiku相似成本的情况下,新模型在每项技能上都有了进一步提升。

另外,Haiku模型的使用价格仅为Sonnet模型的是十二分之一,想必会成为不少开发者的性价比之选。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

Anthropic表示,升级版Claude 3.5 Sonnet已经面向用户开放,而Claude 3.5 Haiku将在本月底,通过API等形式开放(先开放纯文本模型)。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-23 17:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Claude接管人类电脑编程,程序员沸腾!OpenAI反击,智能体大战一触即发
...发商泄露专有信息或代码。OpenAI急了,加码AI年底上新在劲敌Anthropic连连发布重压下,OpenAI其实早已开启了新的布局
2024-10-26 09:53:00
史上最高金额!亚马逊向OpenAI劲敌追投27.5亿美元,估值184亿美元
为了在AI(人工智能)竞赛中取得优势,科技巨头亚马逊正在进行其30年公司历史上最大的一笔外部投资。巴西,显示在手机屏幕上的Anthropic标志
2024-03-28 14:51:00
GPT-4劲敌,谷歌进入高能+高产模式
出品 | 虎嗅科技组作者 | 杜钰君编辑 | 王一鹏头图 | 视觉中国在这场争夺AIGC话语权与领导力的追逐战里,谷歌与微软争相拼臂力秀肌肉
2024-02-21 14:05:00
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,进化后的Claude 3.5 Sonnet一举击溃OpenAI o1,堪称最强推理模型。它在各个方面得到了全面显著的提升
2024-10-23 09:55:00
有道AI学习机X20面世 首创学习机学练机电脑三合一模式
...习硬件来了!1月3日,网易有道在京举办“子曰”教育大模型创新成果发布会,不仅宣布国内首个教育大模型“子曰”升级至2.0版本,重磅推出真正解决全科答疑的全新应用——AI家庭教师
2024-01-04 09:44:00
打工人电脑该换了!自带AI键:周报总结、PPT配图一键搞定
...经被明确:第一,文生文。第二,文生图。第三,个人大模型、个人AI助理。文生文,大语言模型能力涌现的最知名成果,在一键“AIOn”后,通过对话窗口的自然语言交互,就能召唤AI帮
2024-01-12 04:15:00
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...AutoGLM的现场演示。智东西11月29日报道,今日,在国产大模型公司智谱举办的Agent OpenDay上,该公司公布了Agent项目在手机端
2024-12-02 09:50:00
智谱发布电脑智能体大模型GLM-PC:回车即用 协助完成各类电脑任务
...的电脑智能体GLM-PC正式开放体验。这款基于智谱多模态大模型CogAgent的智能体,是全球首个面向公众开放的电脑智能体,能够模拟人类的“观察”和“操作”行为,协助用户高效
2025-01-24 19:34:00
智算领航,移动云携手伙伴共筑大国智能基座!
...方位、高规格展示了其在智算中心建设与技术创新、AI大模型研发、AI+应用等领域的重要成果。移动云持续推动通、智、边一体化管理
2024-05-27 09:18:00
更多关于科技的资讯:
“张叔叔,这银行卡的密码可不能随便告诉别人,就连短信验证码也得藏好,那可是您账户的‘第二把钥匙’”。中信银行石家庄分行网点工作人员一边为70多岁的张叔叔递上一杯水
2025-12-02 10:21:00
中国移动成功举办“AI赋能医院后勤管理新发展”论坛
2025年11月27至29日,由全国卫生产业企业管理协会医院后勤管理发展分会主办的2025年学术会议在杭州召开。中国移动受邀参加“新质生产力助力医院后勤高质量发展”主论坛
2025-12-02 11:03:00
腾讯云姚一兆:用全栈AI助力具身智能赛道加速发展
“具身智能是AI赛道中的焦点,其商业化更依赖技术平台、场景适配与生态协同。腾讯云愿意提供全栈AI服务能力,助力具身智能赛道与广大企业共同发展
2025-12-02 11:03:00
在大健康消费升级与抗衰需求爆发的今天,麦角硫因作为“线粒体级”超级抗氧化剂,已成为膳食补充剂领域的核心赛道。据天猫国际发布的《2023全球超级成分趋势白皮书》显示
2025-12-02 11:31:00
企业数字化转型不断深化,业务系统的可用性、数据安全性和架构弹性正成为企业核心竞争力的重要组成部分。云服务器作为企业 IT 基础设施的底座
2025-12-02 11:42:00
11月21日,富德生命人寿保险股份有限公司在河北石家庄举行以“全维健康守护 创造美好生活”为主题的健康险产品矩阵暨服务升级发布会
2025-12-02 12:11:00
GeneIII仅三麦角硫因胶囊凭借 99.99% 行业顶尖纯度、原生生物合成技术壁垒、三甲医院人体临床验证背书,成为兼具安全性
2025-12-02 14:27:00
从梅酒到书籍:梅见的文化升维之路
步入繁华的商业街区,不难发现一个耐人寻味的现象:店铺橱窗中的传统文化元素,正以近乎重复的方式不断上演。印着汉字 logo 的T恤
2025-12-02 14:35:00
丝玫瑰携手首玺丽格 科创驱动美力升级
2025年12月2日,由键凯科技旗下医美产品线品牌——丝玫瑰®(SILKROSE)与北京首玺丽格联合举办的“中国‘智’造
2025-12-02 15:35:00
白酒+体育IP重构行业营销新范式,五粮液世界杯联名款京东首发
鲁网12月2日讯2026年美加墨男足世界杯分组抽签仪式将于当地时间12月5日在美国华盛顿举行。同日,五粮液FIFA2026世界杯官方联名款产品将在京东直播间重磅首发上市
2025-12-02 15:36:00
从“车间老师傅”到“门店销冠”:飞书AI正在重塑吉利汽车研究院、亚朵酒店的一线战场
当AI逐渐褪去神秘面纱,谁是这场技术变革真正的操盘手?答案是:一线业务人。 近日,首届「飞书AI效率先锋全国大赛」华东赛区半决赛圆满收官
2025-12-02 15:58:00
中新经纬12月2日电 题:即时零售不再打“补贴战”了作者 江瀚 盘古智库高级研究员随着资本耐心减弱,单纯依赖补贴拉动的增长已难以为继
2025-12-02 16:09:00
从二维到三维 从升级到迭代 海底鹰打造水下定点三维成像“新质生产力”
近期,一款具备“定点扫测”功能的国产化三维图像声呐,凭借细腻的图像和独有的成像方式,成为声呐应用领域的“新质生产力”。国产三维搜索声呐破局者“HDY-3DL”来自海底鹰深海科技的三维搜索声呐HDY-3DL
2025-12-02 16:13:00
数字赋能,科技兴农——烟职师生赴烟多地开展校企合作调研
近日,为深化产教融合,推动科技兴农战略落地,烟台职业学院经贸系师生团队一行6人赴烟台栖霞、牟平、高新等地的多家农产品加工企业开展实地调研与合作洽谈
2025-12-02 16:16:00
第三届济南科技金融论坛:共探全周期服务新路径,聚力构建科技金融新生态
鲁网12月2日讯11月27日,第三届济南科技金融论坛在山东大厦成功举办。本届论坛由财新传媒主办、齐鲁银行承办,以“科技金融 深度赋能”为主题
2025-12-02 16:48:00