• 我的订阅
  • 科技

Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强

类别:科技 发布时间:2024-06-21 11:50:00 来源:搜狐科技

Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强

出品|搜狐科技

作者|郑松毅

OpenAI劲敌Anthropic开始还手了!

就在几小时前,Anthropic发布3.5系列第一个版本Claude 3.5 Sonnet。

从官方披露的测试数据来看,其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。

Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强

网友直言,“太卷了,现在AI竞争是要以周为单位了吗?”

从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,分别是“大杯”Claude 3.5 Opus、“中杯”Claude 3.5 Sonnet、及“小杯”Claude 3.5 Haiku。

先问世的“中杯”就这么强,后面的系列模型确实值得期待。官方表示,Claude 3.5 Opus和Claude 3.5 Haiku会在今年晚些时候发布。

话不多说,来看看Claude 3.5 Sonnet这次有哪些亮点。

除了上述提到的逻辑、数学方面,官方声称Claude 3.5 Sonnet是当前最前视觉模型,在标准视觉基准上超越了Claude 3 Opus。

不仅如此,其在视觉数学逻辑推理、科学图解分析、图表分析、文件视觉分析方面表现性能全部优于GPT-4o。

Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强

“重大改进对于需要视觉推理的任务最为明显,例如解释图表和图形,以及可以准确地从不完美的图像中转录文本,这是零售、物流和金融服务领域的核心功能需求。”

另外,为了方便用户和AI界面有更好的交互,让用户能在人机交谈的同一页面看到任务生成情况,Anthropic贴心地推出了Artifacts功能。

可以把该功能理解为动态工作区,当用户在用Claude生成代码,或在进行网页设计时,可以在对话右侧窗口实时查看Claude的创作情况。

Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强

介绍完功能特性,再来说说很多人关心的使用成本。

值得一提的是,与上代“大杯”模型Claude 3 Opus相比,这次的“中杯”Claude 3.5 Sonnet不仅研发成本低,其性能已是最强前辈的两倍。

Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强

官方介绍,该模型每百万输入Tokens收费3美元,每百万输出Tokens收费15美元,具有200K Tokens上下文窗口。

Anthropic表示,目标是每隔几个月就大幅改善智能、速度和成本之间的权衡曲线。除了开发下一代模型系列外,还正在开发新模式和功能,以支持更多企业用例。

谈及AI安全,Anthropic强调,“模型已经过严格安全测试,且会注重保护用户隐私。除非用户明确允许,否则不会使用用户提交的数据来训练我们的生成模型。到目前为止,还没有使用任何客户或用户提交的数据来训练我们的生成模型。”

创始人为OpenAI前成员,获谷歌、亚马逊投资

作为一家创立不久,却有能力和OpenAI正面“掰手腕”的AI企业,Anthropic的优势主要得益于人才的汇聚,以及外界巨头大佬的支持。

2021年,7位与OpenAI发展理解不合的技术人员出逃创立了Anthropic。

带头出走的是一对兄妹,Dario Amodei 和 Daniela Amodei,辞去OpenAI工作的原因是想建立一个安全性和可控性更高的的模型。

离职后,他们还带走了曾在 OpenAI 领导 GPT-3 模型的工程师Tom Brown。

Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强

Dario Amodei(左) 和 Daniela Amodei(右)

据悉,Dario Amodei 在 OpenAI 工作了四年半,最早是 AI 安全的团队负责人,随后升任研究主管、研究副总裁。Daniela Amodei 则在 OpenAI 工作了两年,离职前是 OpenAI 安全和政策副总裁。

Anthropic 创立之初,吸引了Skype联合创始人Jaan Tallinn领投,其他支持者包括Facebook和Asana联合创始人Dustin Moskovitz,和前谷歌首席执行官 Eric Schmidt。目标是在未来与OpenAI一较高下。

2023年,Anthropic这颗“金子”持续发光发热,迎来更多势力雄厚的投资者,其中包括谷歌、亚马逊等科技巨头的参与。

在众多投资者中,谷歌的介入一直引人关注。就在微软高调宣布向 OpenAI 投资 100 亿美元后不久,谷歌向 Anthropic 投资了约 3 亿美元,以换取该公司 10% 的股份。

谷歌如同微软对待OpenAI一样,不仅提供资金支持,还提供训练 AI 模型所需的计算资源,成为Anthropic的强力后援。

Anthropic也是不负众望,近年来多次用产品证明自己,向OpenAI不断施压。

从另一方面来看,AI“角斗场”中的激烈竞技,实际也是在推进技术的更新迭代,以催化出令人更为惊喜的创新应用。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-21 15:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡量AI与“超级智能”距离的重要标尺。OlympicAren
2024-06-25 09:45:00
大模型面临四大关键缺陷,“知识方程”能否通向强人工智能
...大模型面临的最重要的挑战之一。第二,大模型的数学和逻辑推理能力仍然需要加强。虽然GPT-4在某些考试中表现优异,但在面对一些精心设计的逻辑推理问题时,大模型的回答与随机答案相
2023-08-23 11:03:00
能看风水 夸我有情趣 Kimi现在都这么野了吗
...一个道理。在模型 “ 学好数学 ” 的基础上,再将这种逻辑推理的能力应用到物理、化学,乃至于咱们日常生活的方方面面,直到最后真正理解这个世界。而很显然, Kimi 推理模型的
2024-12-19 00:21:00
权威榜单 | 网易易盾入选中国信通院生成式 AI 技术和应用优秀案例
...内容风控的场景理解与知识迁移能力,进行更深层次认知逻辑推理与综合防控;· 基于其提示上下文学习范式以及思维推理过程,内容风控将在不更新模型的基础上更加便捷的适应不同的标准,差
2023-06-07 18:00:00
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...二、社会评测与同行水平社会评测普遍认可o1 系列模型的逻辑推理能力优于 GPT-4o,但也有很多人提出了不同看法。差评XPIN邀请了理综三科的博士测评,物理评价较高,而生物、
2024-09-18 15:01:00
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...后向问题中生成后向推理。在涵盖常识推理、数学推理和逻辑推理的 12 个数据集上进行的实验表明,这一方法比学生模型的零样本性能平均提高了 13
2024-12-10 09:53:00
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...地依赖于训练数据中的模式进行预测。当需要进行真正的逻辑推理时,这些模型往往无法产生合理的结果,这一发现对人工智能的发展提供了重要的参考。虽然LLM在许多领域表现优异,但其推理
2024-10-13 14:15:00
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度的影响,表现出类似的错误倾向。研究背景人类在推理过程中存在两种系
2024-08-19 13:49:00
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...始在一些权威评测中取得领先。今天,国内首款具备中文逻辑推理能力的 o1 模型来了,它便是由昆仑万维推出的「天工大模型 4
2024-11-28 10:00:00
更多关于科技的资讯: