• 我的订阅
  • 科技

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

类别:科技 发布时间:2024-10-23 14:27:00 来源:搜狐科技

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

出品|搜狐科技

作者|郑松毅

OpenAI的劲敌,甩了“大招”!

就在几个小时前,Anthropic AI发布了升级版模型Claude 3.5 Sonnet,以及新模型Claude 3.5 Haiku。

但最吸引人的是,Anthropic AI这次推出了一项处于测试阶段的新功能——AI操作计算机能力(Computer Use)。

网友直呼,“像魔术,AI Agent真的来了。”

AI自己“玩”电脑

这项能力的亮相,似乎又把AI大模型“卷”到了新高度。

之前各大厂商为了提升模型逻辑推理能力,可谓是下了不少功夫。但在“执行”和“操作”能力方面,一直还是饱受吐槽的点,也因此很多人认为大模型距离成为真正的“智能体”还有很大差距。

但现在,可以像人类一样使用计算机的AI,来了。

在Anthropic的演示中,AI可以根据人类指令查看屏幕、移动光标、点击操作、搜索和键入信息。

与此前常见的AI功能不同,用户只需要给定一个任务目标,AI可以一气呵成完成所有操作,全程不再需要任何的人类参与。

比如现在你需要填写一张供应商表格信息,所需数据需要从一份有数千行数据的Excel表格中一一对应查找,先不说要花上多长时间,最可怕的是,找了半天表里还没有你想要的数据。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

现在,你只需要跟AI说一声,它就会从查看屏幕开始,从表里查找匹配的信息并填入相应的目标栏中。如果不幸手中的表里没有目标数据,它会自己上网浏览查询,自动点击切换页面,最终把目标信息填入。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

同样,编写代码对它来说也是不在话下。

当你跟它说想做一个“90年代设计风格”的网站后,它会很快完成代码编写任务。

值得一提的是,你还可以让它把代码文件下载到本地并运行,如果发现你在本地未安装配置Python(代码运行软件),它会自动下载修复报错,省去手动安装的麻烦。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

虽然听起来让人充满期待,但现实是,目前该功能测试漏洞百出,Anthropic正在尽力查缺补漏。

一名内部测试人员介绍,“在一次编码测试中,Claude在中途停了下来,打开了黄石国家公园的图片,接着展开了一系列迷之操作。”

Anthropic表示,为了给用户提供更好的使用体验,目前该功能仅支持开发者通过API配置和调用,想用的小伙伴们还需耐心等一等。

Claude模型升级,数学能力反超OpenAI

看完新功能展示,再来看看本次Claude 3.5系列模型升级变化。

从官方给出的测试数据来看,对比上一代Claude 3.5 Sonnet,升级版模型在逻辑、编程、数学等方面都有明显能力提升。

特别是在数学方面,原本落后于劲敌OpenAI的模型GPT-4o,但这次升级后实现了反超。现在可以说,Claude 3.5 Sonnet是全面“吊打”GPT-4o了。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

全新模型Claude 3.5 Haiku主打的是性价比和响应速度,在与Claude 3 Haiku相似成本的情况下,新模型在每项技能上都有了进一步提升。

另外,Haiku模型的使用价格仅为Sonnet模型的是十二分之一,想必会成为不少开发者的性价比之选。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

Anthropic表示,升级版Claude 3.5 Sonnet已经面向用户开放,而Claude 3.5 Haiku将在本月底,通过API等形式开放(先开放纯文本模型)。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-23 17:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Claude接管人类电脑编程,程序员沸腾!OpenAI反击,智能体大战一触即发
...发商泄露专有信息或代码。OpenAI急了,加码AI年底上新在劲敌Anthropic连连发布重压下,OpenAI其实早已开启了新的布局
2024-10-26 09:53:00
史上最高金额!亚马逊向OpenAI劲敌追投27.5亿美元,估值184亿美元
为了在AI(人工智能)竞赛中取得优势,科技巨头亚马逊正在进行其30年公司历史上最大的一笔外部投资。巴西,显示在手机屏幕上的Anthropic标志
2024-03-28 14:51:00
GPT-4劲敌,谷歌进入高能+高产模式
出品 | 虎嗅科技组作者 | 杜钰君编辑 | 王一鹏头图 | 视觉中国在这场争夺AIGC话语权与领导力的追逐战里,谷歌与微软争相拼臂力秀肌肉
2024-02-21 14:05:00
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,进化后的Claude 3.5 Sonnet一举击溃OpenAI o1,堪称最强推理模型。它在各个方面得到了全面显著的提升
2024-10-23 09:55:00
有道AI学习机X20面世 首创学习机学练机电脑三合一模式
...习硬件来了!1月3日,网易有道在京举办“子曰”教育大模型创新成果发布会,不仅宣布国内首个教育大模型“子曰”升级至2.0版本,重磅推出真正解决全科答疑的全新应用——AI家庭教师
2024-01-04 09:44:00
打工人电脑该换了!自带AI键:周报总结、PPT配图一键搞定
...经被明确:第一,文生文。第二,文生图。第三,个人大模型、个人AI助理。文生文,大语言模型能力涌现的最知名成果,在一键“AIOn”后,通过对话窗口的自然语言交互,就能召唤AI帮
2024-01-12 04:15:00
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...AutoGLM的现场演示。智东西11月29日报道,今日,在国产大模型公司智谱举办的Agent OpenDay上,该公司公布了Agent项目在手机端
2024-12-02 09:50:00
智谱发布电脑智能体大模型GLM-PC:回车即用 协助完成各类电脑任务
...的电脑智能体GLM-PC正式开放体验。这款基于智谱多模态大模型CogAgent的智能体,是全球首个面向公众开放的电脑智能体,能够模拟人类的“观察”和“操作”行为,协助用户高效
2025-01-24 19:34:00
智算领航,移动云携手伙伴共筑大国智能基座!
...方位、高规格展示了其在智算中心建设与技术创新、AI大模型研发、AI+应用等领域的重要成果。移动云持续推动通、智、边一体化管理
2024-05-27 09:18:00
更多关于科技的资讯:
36氪合伙人、副总裁李政:中国产业的未来在哪?| 2025年36氪产业未来大会
9月10日,由36氪主办的2025年36氪产业未来大会在中国厦门盛大启幕。本次大会重磅携手商务部主办的“中国国际投资贸易洽谈会”
2025-09-16 01:03:00
核电“听诊器”打破卡脖子壁垒 中船集团携多款核心产品亮相烟台
齐鲁晚报·齐鲁壹点记者 于民星9月15日,2025山东清洁能源产业博览会和第18届烟台国际核电工业及装备博览会双展联动
2025-09-15 23:49:00
南方电网兴义供电局:职工自研装置投入使用 开启变电设备一键检测新模式
9月11日,在南方电网兴义供电局500千伏仁义变电站内,一套由该局文峰职工创新工作室历经3年自主研发的“无线传输型的氧化锌避雷器多组同步带电检测装置”成功投入使用
2025-09-15 23:11:00
人力资源管理专家汪江涛:以人才体系创新激活企业内生动力
文/许笑“人力资源管理的价值,在于精准识别组织痛点,通过体系搭建、机制创新与人才激活,将人力资源转化为推动企业前行的动能
2025-09-15 11:17:00
长白时评评论员 久泰平近日,围绕“预制菜”的争论持续发酵,引发广泛关注。表面上看,双方争执的焦点是“什么才算预制菜”,实则揭开了餐饮行业一个长期被回避的核心议题
2025-09-15 11:22:00
威海智造 冠军领航 | 从“千规千面”到“千舱千智”,一艘高端客滚船的“冠军制造”算法
大众网记者 宁晓洁 仇艺畅 威海报道威海湾畔,巨轮林立,焊花飞溅。这里是招商工业威海船厂的生产现场,一艘艘高端客滚船正在建设中
2025-09-15 11:26:00
威海智造 冠军领航 | 于“场景”处深耕,向“高端”处跃迁
□宁晓洁9月9日上午,“高质量发展中国行——冠军制造 工赋山东”活动自威海“启程”,三十多位来自中央及省重点媒体的记者
2025-09-15 11:31:00
2025海口第二届卫生健康知识脱口秀大赛进入复赛30强名单出炉
消费日报网讯(记者 郑红梅)9月12日,以“健康椰城 科普达人”为主题的2025海口市第二届卫生健康知识脱口秀大赛完成初评工作
2025-09-15 11:41:00
张家界武陵源AIGC短视频培训为宣传注入科技动能
近日,张家界市武陵源区“镜头有品+网评有巧+AI创造”AIGC短视频培训班开课。全区百余位文旅从业者与短视频创作者齐聚一堂
2025-09-15 11:56:00
响应工信部试点,元萝卜“做家电价格的机器人”锚定养老场景
近日,在工业和信息化部、民政部联合推动的智能养老服务机器人结对攻关与场景应用试点工作背景下,商汤科技旗下家用机器人品牌“元萝卜”成功入选试点名录
2025-09-15 12:11:00
贾少谦:海信没有秘密,只有长期主义的“苦炼”与“修行”
“海信没有秘密,海信的秘密就是坚持长期主义。”9月11日,海信集团董事长贾少谦受邀参加正和岛发起的标杆企业案例分享活动
2025-09-15 12:22:00
罗永浩凌晨“喊话”西贝创始人贾国龙当面对话
大皖新闻讯 近几日,罗永浩与西贝预制菜风波一直持续发酵,霸榜各大平台热搜。9月13日,罗永浩发文称“西贝的事告一段落”
2025-09-15 12:47:00
提供“2500+”岗位 蜀山区秋季首场招聘会走进合肥大学
大皖新闻讯 AI工程师、短剧编剧、金融科技……这些新兴岗位成为招聘会上的“香饽饽”!9月12日,蜀山区秋季招才引智首场招聘会在合肥大学火热开启
2025-09-15 12:47:00
智造世界 创造美好|蚌埠:奋力打造产值超千亿元智能传感产业集聚区
大皖新闻讯 9月12日,2025年世界制造业大会会前集中采访团来到位于蚌埠经济开发区的中国传感谷。“你好,可以和你握个手吗
2025-09-15 12:47:00
九章云极:AI+浪潮下的中国样本,把最新的普惠智算服务带到服贸会
2025年中国国际服务贸易交易会在北京国家会议中心和首钢园区举行。作为全球服务贸易领域最具影响力的年度盛会,历经13年发展的服贸会已成为促进国际经贸合作的重要平台
2025-09-15 13:00:00