• 我的订阅
  • 科技

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

类别:科技 发布时间:2024-10-23 14:27:00 来源:搜狐科技

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

出品|搜狐科技

作者|郑松毅

OpenAI的劲敌,甩了“大招”!

就在几个小时前,Anthropic AI发布了升级版模型Claude 3.5 Sonnet,以及新模型Claude 3.5 Haiku。

但最吸引人的是,Anthropic AI这次推出了一项处于测试阶段的新功能——AI操作计算机能力(Computer Use)。

网友直呼,“像魔术,AI Agent真的来了。”

AI自己“玩”电脑

这项能力的亮相,似乎又把AI大模型“卷”到了新高度。

之前各大厂商为了提升模型逻辑推理能力,可谓是下了不少功夫。但在“执行”和“操作”能力方面,一直还是饱受吐槽的点,也因此很多人认为大模型距离成为真正的“智能体”还有很大差距。

但现在,可以像人类一样使用计算机的AI,来了。

在Anthropic的演示中,AI可以根据人类指令查看屏幕、移动光标、点击操作、搜索和键入信息。

与此前常见的AI功能不同,用户只需要给定一个任务目标,AI可以一气呵成完成所有操作,全程不再需要任何的人类参与。

比如现在你需要填写一张供应商表格信息,所需数据需要从一份有数千行数据的Excel表格中一一对应查找,先不说要花上多长时间,最可怕的是,找了半天表里还没有你想要的数据。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

现在,你只需要跟AI说一声,它就会从查看屏幕开始,从表里查找匹配的信息并填入相应的目标栏中。如果不幸手中的表里没有目标数据,它会自己上网浏览查询,自动点击切换页面,最终把目标信息填入。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

同样,编写代码对它来说也是不在话下。

当你跟它说想做一个“90年代设计风格”的网站后,它会很快完成代码编写任务。

值得一提的是,你还可以让它把代码文件下载到本地并运行,如果发现你在本地未安装配置Python(代码运行软件),它会自动下载修复报错,省去手动安装的麻烦。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

虽然听起来让人充满期待,但现实是,目前该功能测试漏洞百出,Anthropic正在尽力查缺补漏。

一名内部测试人员介绍,“在一次编码测试中,Claude在中途停了下来,打开了黄石国家公园的图片,接着展开了一系列迷之操作。”

Anthropic表示,为了给用户提供更好的使用体验,目前该功能仅支持开发者通过API配置和调用,想用的小伙伴们还需耐心等一等。

Claude模型升级,数学能力反超OpenAI

看完新功能展示,再来看看本次Claude 3.5系列模型升级变化。

从官方给出的测试数据来看,对比上一代Claude 3.5 Sonnet,升级版模型在逻辑、编程、数学等方面都有明显能力提升。

特别是在数学方面,原本落后于劲敌OpenAI的模型GPT-4o,但这次升级后实现了反超。现在可以说,Claude 3.5 Sonnet是全面“吊打”GPT-4o了。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

全新模型Claude 3.5 Haiku主打的是性价比和响应速度,在与Claude 3 Haiku相似成本的情况下,新模型在每项技能上都有了进一步提升。

另外,Haiku模型的使用价格仅为Sonnet模型的是十二分之一,想必会成为不少开发者的性价比之选。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

Anthropic表示,升级版Claude 3.5 Sonnet已经面向用户开放,而Claude 3.5 Haiku将在本月底,通过API等形式开放(先开放纯文本模型)。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-23 17:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Claude接管人类电脑编程,程序员沸腾!OpenAI反击,智能体大战一触即发
...发商泄露专有信息或代码。OpenAI急了,加码AI年底上新在劲敌Anthropic连连发布重压下,OpenAI其实早已开启了新的布局
2024-10-26 09:53:00
史上最高金额!亚马逊向OpenAI劲敌追投27.5亿美元,估值184亿美元
为了在AI(人工智能)竞赛中取得优势,科技巨头亚马逊正在进行其30年公司历史上最大的一笔外部投资。巴西,显示在手机屏幕上的Anthropic标志
2024-03-28 14:51:00
GPT-4劲敌,谷歌进入高能+高产模式
出品 | 虎嗅科技组作者 | 杜钰君编辑 | 王一鹏头图 | 视觉中国在这场争夺AIGC话语权与领导力的追逐战里,谷歌与微软争相拼臂力秀肌肉
2024-02-21 14:05:00
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,进化后的Claude 3.5 Sonnet一举击溃OpenAI o1,堪称最强推理模型。它在各个方面得到了全面显著的提升
2024-10-23 09:55:00
有道AI学习机X20面世 首创学习机学练机电脑三合一模式
...习硬件来了!1月3日,网易有道在京举办“子曰”教育大模型创新成果发布会,不仅宣布国内首个教育大模型“子曰”升级至2.0版本,重磅推出真正解决全科答疑的全新应用——AI家庭教师
2024-01-04 09:44:00
打工人电脑该换了!自带AI键:周报总结、PPT配图一键搞定
...经被明确:第一,文生文。第二,文生图。第三,个人大模型、个人AI助理。文生文,大语言模型能力涌现的最知名成果,在一键“AIOn”后,通过对话窗口的自然语言交互,就能召唤AI帮
2024-01-12 04:15:00
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...AutoGLM的现场演示。智东西11月29日报道,今日,在国产大模型公司智谱举办的Agent OpenDay上,该公司公布了Agent项目在手机端
2024-12-02 09:50:00
智谱发布电脑智能体大模型GLM-PC:回车即用 协助完成各类电脑任务
...的电脑智能体GLM-PC正式开放体验。这款基于智谱多模态大模型CogAgent的智能体,是全球首个面向公众开放的电脑智能体,能够模拟人类的“观察”和“操作”行为,协助用户高效
2025-01-24 19:34:00
智算领航,移动云携手伙伴共筑大国智能基座!
...方位、高规格展示了其在智算中心建设与技术创新、AI大模型研发、AI+应用等领域的重要成果。移动云持续推动通、智、边一体化管理
2024-05-27 09:18:00
更多关于科技的资讯:
□南京日报/紫金山新闻记者何洁实习生杨久久“人工智能+”专项赛中荣获特等奖!11月3日,在第十九届“挑战杯”中国移动全国大学生课外学术科技作品竞赛中
2025-11-06 07:46:00
记者走基层|巧搭“数字积木” 智绘梦想花园
10月29日,承德图布斯科技集团有限公司技术人员正在调试设计图。 河北日报记者 陈宝云摄10月29日,在承德图布斯科技集团有限公司(以下简称“图布斯公司”)的研发中心
2025-11-05 08:12:00
□曹清华党的二十届四中全会提出,实施新时代立德树人工程,促进思政课堂和社会课堂有效融合,加强体育、美育、劳动教育,完善教育评价体系
2025-11-05 08:16:00
2025年沪江网校课程质量高于预期:退费无忧+承诺与践行一致!
一、沪江网校简介为沪江教育旗下品牌,沪江网校自 2009 年成立以来,始终聚焦外语学习者需求,提供网校一对一,凭借专业教学服务与多元课程体系
2025-11-05 14:45:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》显示,2024年我国生成式引擎优化(GEO)市场规模已达47亿元
2025-11-05 14:47:00
在智能体产业快步迈入规模化的当下,南京正以软件产业的深厚积淀、政策生态的精准培育、应用场景的丰富储备,抢占AI科技革命新高点前几天
2025-11-05 15:06:00
Openloong开源社区亮相ROSCon China 2025大会,为智能开源注入新活力
10月31日至11月1日,ROSCon China 2025在上海虹桥新华联索菲特大酒店成功举办。这一汇聚了全球ROS领域顶尖专家与开发者的年度盛会
2025-11-05 15:29:00
职场“反内卷”调研报告 干货多多
近日,智联招聘《职场“反内卷”调研报告》,探究职场人对于“反内卷”的真实态度与选择,了解企业的相应举措。今年“多家知名企业实施强制下班”的新闻冲上热搜
2025-11-05 15:32:00
鲁网11月5日讯“真没想到,资金难题这么快就解决了!东平农商银行的‘同心乐商贷’真是及时雨,我的蛋糕房终于要开起来了。”近日
2025-11-05 15:55:00
中国联通(青岛)智算中心DC1获评“2025年度国家绿色数据中心”
鲁网11月5日讯10月27日,工业和信息化部节能与综合利用司发布《2025年度国家绿色数据中心名单公示》,中国联通(青岛)智算中心DC1荣获“2025年度国家绿色数据中心”称号
2025-11-05 15:57:00
10月19日至20日,2025世界VR产业大会在南昌举行,来自全球VR领域的专家学者、领军企业和业界精英齐聚南昌,共同探讨VR与AI融合发展的新趋势
2025-11-05 17:44:00
语言、技能与数字化:培生亮相CACIE 2025,共筑未来教育新生态
2025年10月29日至11月1日,第26届中国国际教育年会(CACIE)在北京国家会议中心举行。全球终身学习公司培生(FTS: PSON
2025-11-05 18:00:00
找对 “充电站”,心理从业者进阶不迷路!灵动生活集团幸福心理商学苑全维护航
“考下资格证却接不到个案,能做咨询却不懂怎么运营工作室”—— 这是国内超 70% 心理从业者入行后都会遇到的 “成长困境”
2025-11-05 18:01:00
第二十届福州市青少年机器人竞赛圆满落幕 近3500名青少年点燃科创热情
福州新闻网11月5日讯(记者 徐昕昀 文/图)11月2日,随着最后一场机器人竞技挑战赛的终场指令在福州高新区青少年活动中心响起
2025-11-05 18:05:00
全球好物汇聚进博会 67国展示特色产品
大皖新闻讯 月壤样本、时速450公里动车组模型、特斯拉金色无人驾驶车……第八届中国国际进口博览会于11月5日在上海国家会展中心盛大开幕
2025-11-05 19:10:00