• 我的订阅
  • 财经

OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能

类别:财经 发布时间:2024-06-21 12:43:00 来源:澎湃新闻

AI(人工智能)初创企业Anthropic发布自称“迄今为止最智能的模型”。

当地时间6月20日,被视为OpenAI头号竞争对手的AI初创企业Anthropic发布了公司性能最强的AI模型Claude 3.5 Sonnet。据介绍,在覆盖阅读、编程、数学和视觉等领域的多项性能测试中,Claude 3.5 Sonnet的性能基本全面超越了包括GPT-4o在内的一众知名AI模型,仅在MMLU(大规模多任务语言理解)和MATH(数理)数据集上略逊于GPT-4o,且优于自家此前最强的模型Claude 3 Opus。

OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能

来源:Anthropic

在Anthropic此前发布的Claude 3系列模型中,小型模型叫做Haiku,Sonnet是中档模型,最强模型的名字则是Opus。和Claude 3 Opus相比,最新3.5 Sonnet的运行速度可达到前者的两倍,在理解细微差别、幽默和复杂指令方面的表现有显著的提升,并能在生成内容时使用更自然的语气。在内部代理编码评估中,3.5 Sonnet解决了64%的问题,而Opus此前的成绩是38%。

OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能

3.5 Sonnet超越前代Opus。来源:Anthropic

此外,Claude 3.5 Sonnet模型具备强大的“视觉”能力,在标准视觉基准测试中也超过了Claude 3 Opus。在诸如解释图表、图片等处理视觉推理的任务中,3.5 Sonnet可以准确地从不完美的图像中转录文本,对于零售、物流和金融服务等领域的客户来说尤为重要。3.5 Sonnet还可以用于自动化视觉数据处理任务,增强医疗保健、金融服务、媒体和娱乐工作任务中的数据分析。

Anthropic表示,公司致力于“每隔几个月就显著改善智能、速度和成本之间的权衡曲线”,预计Claude 3.5 Haiku和Claude 3.5 Opus将在今年晚些时候推出。

Anthropic的产品负责人Michael Gerstenhaber表示:“对企业来说,重要的是AI能否帮助他们满足业务需求,而不是AI在性能测试中的竞争力如何,从这个角度来看,我相信Claude 3.5 Sonnet将领先于我们现有的任何其他产品,也领先于行业中的所有其他产品。”

在定价方面,新模型定价与前代相同,即每输入3万token定价为3美元,每生成百万token为15美元,并具有20万个token的上下文窗口,约合15万个单词。

现在,用户可以通过Anthropic的网页客户端和iOS应用免费试用新模型,Claude Pro和Claude Team的订阅用户将获得五倍的速率限制。此外,新模型也在Anthropic的API以及亚马逊 Bedrock和谷歌云的Vertex AI等托管平台上上线。

借着推出新模型的机会,Anthropic还为旗下模型引入了一个名为“Artifacts(人工制品)”的新功能。开启该功能后,用户将在对话框旁的一个新窗口中看到Claude生成的结果并与之交互:例如,要求模型设计一个图案,Claude就会在新窗口中展示生成的结果,并根据用户的新需求对结果进行实时编辑。

Anthropic表示,该功能标志着Claude从对话式AI向协作式工作环境的演变,将很快扩展到支持团队协作,让Claude成为工作小组中的一员。

科技网站The Verge指出,Anthropic的进步速度令人惊叹:公司刚于今年3月推出了Claude 3 Opus,现在已经迈出了下一步,相信OpenAI、谷歌等竞争对手很快也会跟上。

今年5月,Anthropic正式推出Claude的iOS端应用程序,并宣布推出针对企业的新付费计划Team,提供比Pro版更多的对话次数,需要至少五名成员加入、每人每月30美元,展现出其在B端扩张的野心。社交媒体Instagram的联合创始人Mike Krieger和OpenAI前安全负责人Jan Leike也都在5月加入了Anthropic。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-21 15:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑
出品|搜狐科技作者|郑松毅OpenAI的劲敌,甩了“大招”!就在几个小时前,Anthropic AI发布了升级版模型Claude 3
2024-10-23 14:27:00
OpenAI竞争对手Anthropic发布最强AI模型
...争对手Anthropic在周四宣布了其迄今为止最强大的人工智能模型Claude3.5Sonnet。Claude3.5在阅读
2024-06-21 17:07:00
GPT-4最强对手出现!Claude-3 AI模型发布
...凌晨Anthropic公司宣布Claude-3正式发布,带有三个高性能的模型形态,并宣布在AI逻辑基准测试中超过了ChatGPT-4
2024-03-10 18:27:00
openai推出最新o1模型引发业界关注
...理性成为企业面临的重要挑战。近期,OpenAI推出的最新o1模型再次引发了业界对AI安全问题的关注。一些专家指出,该模型虽然在推理能力上有显著提升,但同时也表现出更高的欺骗能
2024-11-20 01:29:00
GPT-4劲敌,谷歌进入高能+高产模式
出品 | 虎嗅科技组作者 | 杜钰君编辑 | 王一鹏头图 | 视觉中国在这场争夺AIGC话语权与领导力的追逐战里,谷歌与微软争相拼臂力秀肌肉
2024-02-21 14:05:00
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3
2024-04-19 15:58:00
anthropic发布全新claude2大语言模型
日前,Anthropic发布了全新的Claude2大语言模型。相比前代版本,Claude2性能有所提升,且能够实现更长文本的响应
2023-07-12 18:35:00
腾讯云升级 AI 全家桶,混元对标 GPT-4o
...腾讯云这次也公布了一系列进展。首先是发布了新一代大模型「混元 Turbo」,相较前代,混元 Turbo 性能大幅提升
2024-09-06 09:59:00
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,进化后的Claude 3.5 Sonnet一举击溃OpenAI o1,堪称最强推理模型。它在各个方面得到了全面显著的提升
2024-10-23 09:55:00
更多关于财经的资讯:
大河网讯 日前,郑州银行正式披露2025年度经营业绩。在复杂多变的宏观环境中,这家根植中原的区域性银行以稳促进、以质取胜
2026-04-05 11:10:00
A股8家全国第一,港股5家并列第三 “隐形冠军”最吃香2026年一季度,A股、港交所新股市场表现积极,浙江企业表现尤为亮眼
2026-04-05 13:09:00
齐鲁制药1类新药注射用QLS5132联合疗法获批临床
3月31日,据国家药监局药品审评中心(CDE)官网公示,齐鲁制药1类新药注射用QLS5132联合用药治疗晚期实体瘤的适应症获得临床试验默示许可
2026-04-05 10:35:00
山海见日照 齐鲁向新行 ——齐鲁银行日照分行高质量发展纪实
黄海潮起,金融澎湃。2025年,齐鲁银行日照分行紧跟总行战略部署,以“稳中求进、以进促稳”为发展航标,胸怀“入主流、争一流”的奋斗目标
2026-04-05 10:36:00
齐鲁制药富马酸福莫特罗吸入溶液(畅齐享®)获批上市,为慢阻肺治疗提供便捷新选择
3月27日,据国家药品监督管理局官网公示,齐鲁制药富马酸福莫特罗吸入溶液(畅齐享®)获得批准上市,该产品主要用于慢性阻塞性肺疾病(COPD
2026-04-05 10:37:00
“数”里行间看春日中国经济“跃动”前行
120亿元电影票房见证影市生机勃发2.96亿人次在假期跨越山海1.5亿亩春灌沃野润泽良田......从生产到消费、从出行到物流本周一项项指标回升向好一个个领域暖意渐浓这不仅是数据
2026-04-05 08:35:00
开奖了!烟台有奖发票第三期抽出2000万元奖金
胶东在线4月3日讯(记者 王向荣 摄影 李刚)4月3日晚,烟台市融媒体中心仙境烟台发布厅内气氛热烈,“票”享惊喜,“奖”动烟台——烟台市有奖发票第三期线上抽奖活动如期举行
2026-04-05 02:03:00
东南网龙岩4月4日讯 近日,淮河能源控股集团成功发行“并购+乡村振兴”中期票据,三期发行规模合计30亿元,由兴业银行担任第二期牵头主承销商
2026-04-04 23:16:00
4月4日从大唐太原第二热电厂获悉,今年太原二热以“管理提升年”为抓手,顺利实现一季度起步稳、开门红,实现首季盈利。在经营管理方面
2026-04-04 17:35:00
晋州农商行多项违规被罚225万,河北北人冀通支付被通报批评罚14万
2026年4月3日,中国人民银行河北省分行发布了一则行政处罚信息,对河北北人冀通支付服务有限公司、河北晋州农村商业银行股份有限公司作出行政处罚
2026-04-04 14:20:00
妙可蓝多一季度开门红,营收大涨31.81%,扣非净利双位数增长
4月3日,国内奶酪龙头妙可蓝多发布2026年第一季度业绩快报,公司一季度实现营业总收入16.26亿元,同比大幅增长31
2026-04-04 12:24:00
近日国内金价频繁波动,石家庄黄金零售和回收市场迅速降温,顾客稀少、成交低迷,回收市场也基本无人卖金。河北经贸大学金融学院教师董岚建议,普通家庭购金应以保值避险为核心,区分消费与投
2026-04-04 08:18:00
最近,经常在媒体上看到“全国统一大市场建设纵深推进”。有点不太明白,这项工作与大家的生活有多大关系?谁能从中受益?——人民网网友建设全国统一大市场
2026-04-04 08:42:00
国家标准化管理委员会近日发布公告,《移动电源安全技术规范》(GB 47372—2026)(以下简称《技术规范》)已正式发布
2026-04-04 08:42:00
黄骅港煤炭下水量实现首季“开门红”
4月1日拍摄的黄骅港煤炭港区。今年一季度国能黄骅港务公司累计完成煤炭卸车5541万吨煤炭装船5481.8万吨同比增长均超过10%高质量实现首季“开门红”4月2日拍摄的黄骅港煤炭港
2026-04-04 09:00:00