• 我的订阅
  • 财经

OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能

类别:财经 发布时间:2024-06-21 12:43:00 来源:澎湃新闻

AI(人工智能)初创企业Anthropic发布自称“迄今为止最智能的模型”。

当地时间6月20日,被视为OpenAI头号竞争对手的AI初创企业Anthropic发布了公司性能最强的AI模型Claude 3.5 Sonnet。据介绍,在覆盖阅读、编程、数学和视觉等领域的多项性能测试中,Claude 3.5 Sonnet的性能基本全面超越了包括GPT-4o在内的一众知名AI模型,仅在MMLU(大规模多任务语言理解)和MATH(数理)数据集上略逊于GPT-4o,且优于自家此前最强的模型Claude 3 Opus。

OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能

来源:Anthropic

在Anthropic此前发布的Claude 3系列模型中,小型模型叫做Haiku,Sonnet是中档模型,最强模型的名字则是Opus。和Claude 3 Opus相比,最新3.5 Sonnet的运行速度可达到前者的两倍,在理解细微差别、幽默和复杂指令方面的表现有显著的提升,并能在生成内容时使用更自然的语气。在内部代理编码评估中,3.5 Sonnet解决了64%的问题,而Opus此前的成绩是38%。

OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能

3.5 Sonnet超越前代Opus。来源:Anthropic

此外,Claude 3.5 Sonnet模型具备强大的“视觉”能力,在标准视觉基准测试中也超过了Claude 3 Opus。在诸如解释图表、图片等处理视觉推理的任务中,3.5 Sonnet可以准确地从不完美的图像中转录文本,对于零售、物流和金融服务等领域的客户来说尤为重要。3.5 Sonnet还可以用于自动化视觉数据处理任务,增强医疗保健、金融服务、媒体和娱乐工作任务中的数据分析。

Anthropic表示,公司致力于“每隔几个月就显著改善智能、速度和成本之间的权衡曲线”,预计Claude 3.5 Haiku和Claude 3.5 Opus将在今年晚些时候推出。

Anthropic的产品负责人Michael Gerstenhaber表示:“对企业来说,重要的是AI能否帮助他们满足业务需求,而不是AI在性能测试中的竞争力如何,从这个角度来看,我相信Claude 3.5 Sonnet将领先于我们现有的任何其他产品,也领先于行业中的所有其他产品。”

在定价方面,新模型定价与前代相同,即每输入3万token定价为3美元,每生成百万token为15美元,并具有20万个token的上下文窗口,约合15万个单词。

现在,用户可以通过Anthropic的网页客户端和iOS应用免费试用新模型,Claude Pro和Claude Team的订阅用户将获得五倍的速率限制。此外,新模型也在Anthropic的API以及亚马逊 Bedrock和谷歌云的Vertex AI等托管平台上上线。

借着推出新模型的机会,Anthropic还为旗下模型引入了一个名为“Artifacts(人工制品)”的新功能。开启该功能后,用户将在对话框旁的一个新窗口中看到Claude生成的结果并与之交互:例如,要求模型设计一个图案,Claude就会在新窗口中展示生成的结果,并根据用户的新需求对结果进行实时编辑。

Anthropic表示,该功能标志着Claude从对话式AI向协作式工作环境的演变,将很快扩展到支持团队协作,让Claude成为工作小组中的一员。

科技网站The Verge指出,Anthropic的进步速度令人惊叹:公司刚于今年3月推出了Claude 3 Opus,现在已经迈出了下一步,相信OpenAI、谷歌等竞争对手很快也会跟上。

今年5月,Anthropic正式推出Claude的iOS端应用程序,并宣布推出针对企业的新付费计划Team,提供比Pro版更多的对话次数,需要至少五名成员加入、每人每月30美元,展现出其在B端扩张的野心。社交媒体Instagram的联合创始人Mike Krieger和OpenAI前安全负责人Jan Leike也都在5月加入了Anthropic。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-21 15:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑
出品|搜狐科技作者|郑松毅OpenAI的劲敌,甩了“大招”!就在几个小时前,Anthropic AI发布了升级版模型Claude 3
2024-10-23 14:27:00
OpenAI竞争对手Anthropic发布最强AI模型
...争对手Anthropic在周四宣布了其迄今为止最强大的人工智能模型Claude3.5Sonnet。Claude3.5在阅读
2024-06-21 17:07:00
GPT-4最强对手出现!Claude-3 AI模型发布
...凌晨Anthropic公司宣布Claude-3正式发布,带有三个高性能的模型形态,并宣布在AI逻辑基准测试中超过了ChatGPT-4
2024-03-10 18:27:00
openai推出最新o1模型引发业界关注
...理性成为企业面临的重要挑战。近期,OpenAI推出的最新o1模型再次引发了业界对AI安全问题的关注。一些专家指出,该模型虽然在推理能力上有显著提升,但同时也表现出更高的欺骗能
2024-11-20 01:29:00
GPT-4劲敌,谷歌进入高能+高产模式
出品 | 虎嗅科技组作者 | 杜钰君编辑 | 王一鹏头图 | 视觉中国在这场争夺AIGC话语权与领导力的追逐战里,谷歌与微软争相拼臂力秀肌肉
2024-02-21 14:05:00
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3
2024-04-19 15:58:00
anthropic发布全新claude2大语言模型
日前,Anthropic发布了全新的Claude2大语言模型。相比前代版本,Claude2性能有所提升,且能够实现更长文本的响应
2023-07-12 18:35:00
腾讯云升级 AI 全家桶,混元对标 GPT-4o
...腾讯云这次也公布了一系列进展。首先是发布了新一代大模型「混元 Turbo」,相较前代,混元 Turbo 性能大幅提升
2024-09-06 09:59:00
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,进化后的Claude 3.5 Sonnet一举击溃OpenAI o1,堪称最强推理模型。它在各个方面得到了全面显著的提升
2024-10-23 09:55:00
更多关于财经的资讯:
山东新春消费季火热开启,董宇辉向全球发出“齐鲁邀约”
1月25日上午,由山东省商务厅主办的“悦消费 惠新春”2026山东迎新春消费季启动式在济南舜耕国际会展中心举行。本次活动以“三餐四季暖齐鲁 烟火人间迎新年”为主题
2026-01-25 18:26:00
新华社讯 近期,国际、国内金价屡屡刷新历史纪录,在高金价刺激下,部分消费者选择高位套现。记者采访了解到,深圳水贝等黄金集散地回收档口人潮涌动
2026-01-25 09:18:00
新华社讯 主要金属价格持续上涨引发投资热潮。在黄金、白银价格屡创新高后,涨势强劲、克价更低的铜也成为热门投资品,市场上出现“纯铜999
2026-01-25 07:47:00
九号公司发布智能电动车“双品牌+全球化”战略
1月24日,九号公司创始人兼CEO王野在2026用户大会宣布,九号智能电动车国内累计出货量已突破1000万台。站在这一全新起点
2026-01-24 19:14:00
贵阳市南明区市场监管局以“三送”服务赋能药械经营
近日,贵阳市南明区市场监管局依托健康药械服务站,创新推出“送想法、送标准、送经验”精准帮扶举措,在行业整体承压背景下,为药械企业稳经营
2026-01-24 19:40:00
四川成都春节租车市场提前预热 热门车型预订过半
临近春节,四川成都的租车市场开始升温,不少市民早早预订车辆,为春节出行做准备。今年春节租车价格有何变化?哪些车型更受青睐
2026-01-24 07:57:00
向中度以上失能老年人发放养老服务消费补贴,今年在全国范围内组织实施,为期一年12个自然月。这项政策是面向中度以上失能老年人的一项大规模的惠民政策
2026-01-24 07:57:00
国家统计局1月19日发布2025年国民经济运行情况后,全国多省份“经济年报”陆续公布。其中,河南2025年地区生产总值达到66633亿元
2026-01-24 07:57:00
瑞众保险山东分公司枣庄台儿庄支公司走进台儿庄区夹坊村开展养老领域防范非法金融活动“进农村”宣传活动
为切实守护农村老年群体财产安全,提升老年人防范非法金融活动的意识与能力,近日,瑞众保险山东分公司枣庄台儿庄支公司组织走进台儿庄区夹坊村
2026-01-23 20:00:00
瑞众保险山东分公司潍坊中支开展宪法宣传日暨金融知识普及活动
瑞众保险山东分公司潍坊中支开展宪法宣传日暨金融知识普及活动为切实提升广大群众的法律意识与金融风险防范能力,营造全民学法
2026-01-23 20:04:00
以“规范”见真心,以“善用”显价值——瑞众保险济宁中支公益行动的双重奏
“君子务本,本立而道生。”对于保险企业而言,“规范”即是其生存发展之“本”,而帮助客户“善用”保险,则是其创造价值之“道”
2026-01-23 20:04:00
Wind数据显示,下周限售股上市数量共计6.31亿股,以1月23日收盘价计算,解禁市值约为393.09亿元,较本周分别下降了74
2026-01-23 22:20:00
上大股份(301522)主要从事高温及高性能合金、高品质特种不锈钢等特种合金产品的研发、生产和销售,实现了高温合金等国家关键战略材料的高质量
2026-01-23 22:20:00
下周,美联储将公布利率决议;国家统计局将公布1月PMI数据。另外,下周将有3只新股发行。美联储将公布利率决议下周,美联储将公布利率决议
2026-01-23 22:20:00