• 我的订阅
  • 科技

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

类别:科技 发布时间:2024-10-23 14:27:00 来源:搜狐科技

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

出品|搜狐科技

作者|郑松毅

OpenAI的劲敌,甩了“大招”!

就在几个小时前,Anthropic AI发布了升级版模型Claude 3.5 Sonnet,以及新模型Claude 3.5 Haiku。

但最吸引人的是,Anthropic AI这次推出了一项处于测试阶段的新功能——AI操作计算机能力(Computer Use)。

网友直呼,“像魔术,AI Agent真的来了。”

AI自己“玩”电脑

这项能力的亮相,似乎又把AI大模型“卷”到了新高度。

之前各大厂商为了提升模型逻辑推理能力,可谓是下了不少功夫。但在“执行”和“操作”能力方面,一直还是饱受吐槽的点,也因此很多人认为大模型距离成为真正的“智能体”还有很大差距。

但现在,可以像人类一样使用计算机的AI,来了。

在Anthropic的演示中,AI可以根据人类指令查看屏幕、移动光标、点击操作、搜索和键入信息。

与此前常见的AI功能不同,用户只需要给定一个任务目标,AI可以一气呵成完成所有操作,全程不再需要任何的人类参与。

比如现在你需要填写一张供应商表格信息,所需数据需要从一份有数千行数据的Excel表格中一一对应查找,先不说要花上多长时间,最可怕的是,找了半天表里还没有你想要的数据。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

现在,你只需要跟AI说一声,它就会从查看屏幕开始,从表里查找匹配的信息并填入相应的目标栏中。如果不幸手中的表里没有目标数据,它会自己上网浏览查询,自动点击切换页面,最终把目标信息填入。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

同样,编写代码对它来说也是不在话下。

当你跟它说想做一个“90年代设计风格”的网站后,它会很快完成代码编写任务。

值得一提的是,你还可以让它把代码文件下载到本地并运行,如果发现你在本地未安装配置Python(代码运行软件),它会自动下载修复报错,省去手动安装的麻烦。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

虽然听起来让人充满期待,但现实是,目前该功能测试漏洞百出,Anthropic正在尽力查缺补漏。

一名内部测试人员介绍,“在一次编码测试中,Claude在中途停了下来,打开了黄石国家公园的图片,接着展开了一系列迷之操作。”

Anthropic表示,为了给用户提供更好的使用体验,目前该功能仅支持开发者通过API配置和调用,想用的小伙伴们还需耐心等一等。

Claude模型升级,数学能力反超OpenAI

看完新功能展示,再来看看本次Claude 3.5系列模型升级变化。

从官方给出的测试数据来看,对比上一代Claude 3.5 Sonnet,升级版模型在逻辑、编程、数学等方面都有明显能力提升。

特别是在数学方面,原本落后于劲敌OpenAI的模型GPT-4o,但这次升级后实现了反超。现在可以说,Claude 3.5 Sonnet是全面“吊打”GPT-4o了。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

全新模型Claude 3.5 Haiku主打的是性价比和响应速度,在与Claude 3 Haiku相似成本的情况下,新模型在每项技能上都有了进一步提升。

另外,Haiku模型的使用价格仅为Sonnet模型的是十二分之一,想必会成为不少开发者的性价比之选。

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑

Anthropic表示,升级版Claude 3.5 Sonnet已经面向用户开放,而Claude 3.5 Haiku将在本月底,通过API等形式开放(先开放纯文本模型)。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-23 17:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Claude接管人类电脑编程,程序员沸腾!OpenAI反击,智能体大战一触即发
...发商泄露专有信息或代码。OpenAI急了,加码AI年底上新在劲敌Anthropic连连发布重压下,OpenAI其实早已开启了新的布局
2024-10-26 09:53:00
史上最高金额!亚马逊向OpenAI劲敌追投27.5亿美元,估值184亿美元
为了在AI(人工智能)竞赛中取得优势,科技巨头亚马逊正在进行其30年公司历史上最大的一笔外部投资。巴西,显示在手机屏幕上的Anthropic标志
2024-03-28 14:51:00
GPT-4劲敌,谷歌进入高能+高产模式
出品 | 虎嗅科技组作者 | 杜钰君编辑 | 王一鹏头图 | 视觉中国在这场争夺AIGC话语权与领导力的追逐战里,谷歌与微软争相拼臂力秀肌肉
2024-02-21 14:05:00
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,进化后的Claude 3.5 Sonnet一举击溃OpenAI o1,堪称最强推理模型。它在各个方面得到了全面显著的提升
2024-10-23 09:55:00
有道AI学习机X20面世 首创学习机学练机电脑三合一模式
...习硬件来了!1月3日,网易有道在京举办“子曰”教育大模型创新成果发布会,不仅宣布国内首个教育大模型“子曰”升级至2.0版本,重磅推出真正解决全科答疑的全新应用——AI家庭教师
2024-01-04 09:44:00
打工人电脑该换了!自带AI键:周报总结、PPT配图一键搞定
...经被明确:第一,文生文。第二,文生图。第三,个人大模型、个人AI助理。文生文,大语言模型能力涌现的最知名成果,在一键“AIOn”后,通过对话窗口的自然语言交互,就能召唤AI帮
2024-01-12 04:15:00
智谱发布电脑智能体大模型GLM-PC:回车即用 协助完成各类电脑任务
...的电脑智能体GLM-PC正式开放体验。这款基于智谱多模态大模型CogAgent的智能体,是全球首个面向公众开放的电脑智能体,能够模拟人类的“观察”和“操作”行为,协助用户高效
2025-01-24 19:34:00
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...AutoGLM的现场演示。智东西11月29日报道,今日,在国产大模型公司智谱举办的Agent OpenDay上,该公司公布了Agent项目在手机端
2024-12-02 09:50:00
智算领航,移动云携手伙伴共筑大国智能基座!
...方位、高规格展示了其在智算中心建设与技术创新、AI大模型研发、AI+应用等领域的重要成果。移动云持续推动通、智、边一体化管理
2024-05-27 09:18:00
更多关于科技的资讯:
实现从光芯片设计到模块封装量产每日商报讯 近日,位于拱墅区大运河数智未来城省级高新区核心区块的拱政工出【2025】6号地块标准厂房(一期)项目(以下称“芯速联高速硅光模块智能制造基地”)正式完工
2026-03-12 08:12:00
涂鸦智能:以开放平台与AI能力重塑宠物喂食器解决方案
宠物智能用品正从基础的“联网控制”迈向“主动关怀”的深度智能时代。传统宠物喂食器多限于手机App远程定时出粮,难以应对动态调整食量
2026-03-12 08:34:00
纵览原创|石家庄“装虾”线上线下冰火两重天:多家线下店铺称“没听说过”,有线上卖家已安装20多单
见习记者 朱荣琛“你养龙虾了吗?”成为近期网络热议的话题。最近,这款名为OpenClaw(网友俗称“龙虾”)的开源AI智能体工具迅速走红网络
2026-03-12 08:47:00
长白时评评论员 崔越然近期一款名为OpenClaw的开源人工智能体工具火遍全网,因其鲜红的图标被广大网民亲切地称为“龙虾”
2026-03-12 10:29:00
想尝鲜,又怕烫手 西湖边,数百人排队免费领养本地版“龙虾”
西湖边掀起“养虾”热潮。春夜渐凉,西湖边的“养虾”热潮,到昨晚8点仍没有退去。从中午开始,滨次元AI文旅驿站外的12号场地就排起了长队
2026-03-12 09:13:00
杭州日报讯 近日,在中国纺织信息中心浙江分中心·国际纺织时尚交流中心的组织下,涛搏纺织、凯亨纺织、卓伦纺织、优时进出口等10家绍兴柯桥纺织标杆企业组团亮相越南西贡会展中心
2026-03-12 07:11:00
杭州日报讯 “开年前两个月,订单量同比两位数增长,完成甚至突破预定生产目标,我们信心很足!”“产线满负荷运转,订单排得满满当当
2026-03-12 07:11:00
数字贸易平台海外版上线杭州日报讯 昨日,在2026年中国国际针织(春夏)博览会上,濮院毛衫数字贸易平台海外版正式上线,其专属海外品牌“PlinkX”同步亮相
2026-03-12 07:11:00
推动进口贸易与消费升级深度融合杭州日报讯 为深入推进高水平对外开放,释放中国超大规模市场红利,推动进口贸易与消费升级深度融合
2026-03-12 07:11:00
82岁老人换了新手机,但不熟悉操作,结果误开通多项收费业务。3月11日,老人收到扣费短信后向网格员求助,顺利取消了扣费服务
2026-03-11 17:36:00
中新经纬3月11日电 (董湘依)近年来,中国文化“新三样”(网文、网剧、网游)在海外迅速走红。全国两会期间,全国政协委员
2026-03-11 19:27:00
中新经纬3月11日电 题:“养龙虾”火出圈 ,算力变成稀缺资源作者 薛洪言 星图金融研究院常务副院长、苏商银行特约研究员2026年的早春
2026-03-11 19:28:00
河北新闻网讯(闫丽颖、唐福刚)近日,开滦股份范各庄矿聚焦“物理隔离+智能管控”核心需求,创新应用一套具备智能闭锁、声光报警
2026-03-11 19:51:00
中国联通eSIM尝鲜季再添新力
3月11日上午,中国联通eSIM尝鲜季——三星国内首款eSIM手机Galaxy S26系列首销仪式在西单北营业厅隆重举行
2026-03-11 14:14:00
大皖新闻讯 家里空调、冰箱等家电出故障,找维修却怕遇上“小病大修”“坐地起价”。别愁,专为安徽消费者打造的家电维修“放心平台”来了
2026-03-11 14:55:00