• 我的订阅
  • 科技

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

类别:科技 发布时间:2024-04-03 16:49:00 来源:智东西
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

智东西4月2日报道,今天,亚马逊云科技(AWS)与智东西等少数媒体分享了与AI创企Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。

AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加深,Amazon Bedrock引入了Anthropic最新发布的Claude 3模型。

会后,AWS大中华区产品部总经理陈晓建向我们分享了大模型落地实践的解读。在他看来,大模型想要打通落地最后N公里,需要选择一个具体的、简单的切入点,从点到面逐步扩展应用场景,由简单到复杂逐步切入。

当谈到AWS下一步的发展战略时,他称从客户需求来看,目前芯片等硬件设施仍然落后于大模型的发展,其迭代速度跟不上模型参数规模的指数级提升,如何将底层能力与大模型复杂度相匹配,是现在面临的主要挑战。

一、从基础设施、工具链到AI应用,构建生成式AI完整技术栈

陈晓建首先解读了AWS的生成式AI技术栈。目前,AWS在基础设施层面提供GPUs、自研Trainium芯片、Nitro系统等底层设施,在大模型构建工具层面提供大模型托管平台Amazon Bedrock,在应用层面则推出了智能助手Amazon Q、代码助手Amazon CodeWhisperer等。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲AWS生成式AI技术栈

在模型层面,除了此前提供的AI21Labs、Cohere、Meta、Stability AI以及亚马逊自研的模型之外,近期新增了Anthropic和法国创企Mistral AI的新模型。其中,Anthropic的Claude 3以其多模态推理、翻译、总结等方面的优异能力突出。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲Amazon Bedrock提供的基础模型

Claude 3于3月初推出,分为Opus、Sonnet、Haiku三个规模,其中性能最强的Opus模型引各方面测评结果超越GPT-4一举成为“最强大模型”。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲Claude 3各模型性能对比

与Claude 2相比,Claude 3最明显的迭代体现在多模态能力、幻觉的降低、长文本能力等方面。例如借助视觉能力,Claude 3可以理解图表、图形、报告等文件,并从中提取数据。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲Claude 3的多模态能力

在准确率方面,Claude 3大幅改善了幻觉问题,对没有把握的答案会进行标明,而不是直接给出错误答案。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲Claude 3幻觉降低

在应用场景上,Claude 3可以适用于代码辅助、内容续写、长文本知识召回总结等,也可以用在亚马逊的“老本行”电商领域,用来撰写电商商品描述。

基于Amazon Bedrock的能力,AWS面向企业提供了知识库工具Knowledge Bases,为基础模型和Agents提供来自企业内部数据源的上下文信息,用于RAG(检索增强生成),从而提供更相关、更准确和更个性化的响应。

Amazon Bedrock的Agents功能则利用基础模型,提供使用自然语言进行交互和响应来执行多步骤业务任务的能力。

二、现场演示为老黄续写PPT,扮演不同MBTI人格答题

AWS技术人员为我们现场演示了Claude 3“中杯”模型Sonnet的多模态、长文本、代码、翻译等能力。

在第一个演示中,演示人员输入了一张英伟达CEO黄仁勋演讲的PPT,让Claude总结PPT的内容。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲输入的PPT图像

明显能看出,Amazon Bedrock上搭载的Claude 3生成速度非常快,迅速总结出了PPT上主要内容。

随后,演示人员追问Claude 3下一页PPT可以考虑放哪些内容,又让其按年份总结图中内容,并归纳为表格形式。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲Claude 3将PPT内容总结为表格形式

第二个演示展现了Claude 3的长文本能力。演示人员输入小说《流浪地球》中的一个片段,在其中插入了一句《三体》中的内容,让Claude 3从中找出不合理的部分。

这是大模型长文本能力评测中十分重要的一种测试。AWS大中华区产品技术总监王晓野谈道,之所以长文本能力这么重要,是因为在情感陪伴、资料读取等应用场景中,对大模型的“记忆”能力要求很高。尤其是AI陪伴类产品,如果大模型能记住几个月甚至几年前用户聊过的内容,体验感会大幅提升。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲Claude 3大海捞针能力

随后演示人员又展示了Claude 3的诗歌翻译能力,并与GPT-4做对比。虽然二者都未达到“信达雅”的水准,但Claude 3的翻译用语更贴合中文用词习惯一些。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲Claude 3翻译能力

第四个演示针对代码能力,演示人员要求Claude 3生成一个贪吃蛇游戏的Python代码设计,并给出了基本玩法和失败条件。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲贪吃蛇游戏Prompt

Claude 3按照需求生成了一个完整的代码文档,演示人员将代码复制到编译器中运行,贪吃蛇游戏成功运行起来,并且符合失败条件,在蛇撞到地图边缘时游戏结束。

最后,演示人员展示了Claude 3的开放性问题理解能力。通过一个网上很火的性格测试MBTI的问题,让大模型判断不同MBTI人格对同一个问题的反应:如果看到一匹马进入酒吧,你认为马会说什么?

在扮演ESTJ、ENFP两种不同人格时,Claude 3分别站在理性务实、富有想象力和创造力的角度回答了这个问题。

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲Claude 3扮演ESTJ人格

AWS搭载“最强大模型”!40亿美元投向OpenAI竞对

▲Claude 3扮演ENFP人格

结语:AWS为企业客户打通大模型落地“最后三公里”

通过投资Anthropic和提供Claude 3模型,AWS再次提升了作为云平台的竞争力。相比直接使用Claude 3的API(应用程序接口),Amazon Bedrock能够提供更为稳定的大模型能力,并通过知识库、Agents等工具提供差异化价值,帮助企业平衡成本与模型能力。

通过构建完整的生成式AI技术栈,从基础设施到工具链,再到具体的AI应用,AWS全方位支持企业客户数字化转型。Amazon Bedrock平台为企业提供了强大的知识库工具和Agents功能,使得大模型的应用更加贴合实际业务需求,同时,AWS还通过试验迭代、专业培训、原型开发等服务,为企业用户提供打通大模型落地的“最后三公里”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-03 17:45:20

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
出品 | 搜狐科技作者 | 梁昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上
2023-04-14 14:00:00
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方
2024-01-31 07:32:00
推动终端侧AI发展 MWC2024高通带来多项全球首发
...高通平台打造AI应用。高通AIHub为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署
2024-02-29 10:14:00
两个周鸿祎 杀入“百模大战”
...的数字分身一起。6月13日,360在北京发布了认知型通用大模型“360智脑4.0”。此时距离3月底360智脑大模型1
2023-06-14 11:31:00
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...技术方向,仍然值得关注,但可以明确的是,随着大型AI模型的产业化进程不断深入,国内外参与者也越来越冷静,更加专注于自身的AI策略与节奏。有人将这两场发布会比作是一场斗地主游戏
2024-05-19 16:32:00
单卡算力对标英伟达A100,科大讯飞联手华为发布星火一体机
进入2023年8月,从年初开始的大模型、人工智能热潮逐渐归于理性,进入了落地应用阶段。越来越多人开始思考,大模型的落地究竟会行业带来哪些实打实的变化?大模型背后庞大的算力,能否做
2023-08-16 22:01:00
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两
2024-05-17 17:26:00
高通aihub正式发布:支持75个ai模型
...用。具体来说,高通AIHub可以为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。开发者只需选择应用所需的模型以及其开发
2024-02-27 02:14:00
360智脑大模型重新定义AI数字人
...6月13日,三六零(601360.SH,下称“360”)公司召开360智脑大模型应用发布会,认知型通用大模型“360智脑4
2023-06-14 12:18:00
更多关于科技的资讯:
国家级5G工厂,钟经开+1!
近日,工业和信息化部公示了《2025年5G工厂名录》钟楼经济开发区企业江苏电力装备有限公司成功入选成为继江苏精研科技股份有限公司后钟楼区第二家国家级5G工厂5G工厂是充分利用以5G为代表的新一代信息通信技术
2025-09-06 06:08:00
从玻璃到微纳新材料 从企业更名看龙口一家民企的转型跃迁
大众网记者 林晓冬 烟台报道说起玻璃大家都不陌生,餐桌玻璃、门窗玻璃都与我们的日常生活息息相关,但在烟台龙口有一家企业多年来持续在玻璃上“钻研”
2025-09-05 09:08:00
科创泉城 智启未来| “硬科创”需要“软传播”,网络达人共话“出圈”新思路
9月4日下午,在济南市委网信办联合山东省互联网传媒集团举办的“科创泉城 智启未来”知名网络达人济南采风活动的对话沙龙上
2025-09-05 09:51:00
本报讯(记者雷嘉)围绕国产车规级芯片搭载应用,北京市科委、中关村管委会会同北京市智慧城市基础设施与智能网联汽车协同发展办公室
2025-09-05 11:08:00
河北新闻网讯(王丽英)“后厨不只是生产中心,更是服务体验的心脏。”“服务不仅仅是完成交易的过程,更是以关怀为主利他主义精神的体现
2025-09-05 11:08:00
海信冰箱五款产品通过中国家用电器研究院自动制冰性能认证
日前,经中国家用电器研究院严格检测与评估,海信冰箱旗下五款产品成功通过“电冰箱自动制冰性能认证”,并获颁认证证书。此次获证不仅是对海信冰箱自动制冰技术性能的肯定
2025-09-05 11:57:00
京东全球80+高校招聘 清华、剑桥等80校专场 现场面试拿offer!
9月5日,京东招聘公众号发文:全球80+高校!京东2026校园招聘进校行程发布。文中称:将在全球20+城市,80+院校
2025-09-05 12:10:00
花一万元植入DeepSeek,一场没有终点的流量游戏
文|邓咏仪编辑|苏建勋让你的产品在DeepSeek的答案里有一席之地,需要多少钱?答案是:数千甚至上万元。人在哪,流量就在哪
2025-09-05 14:56:00
爱尔眼科开启老视多学科诊疗新时代
9月4日,2025年屈光性白内障手术国际论坛(IRCS)暨第一届老视矫正MDT管理国际高峰论坛在杭州举办我国超八成60岁以上老年人正面临老视(老花眼)与白内障的“双重眼病困扰”
2025-09-05 15:18:00
获SIAL创新奖:诺啦格兰诺拉脆片让生活更美好  
消费日报网讯 9月1日,在2025 SIAL西雅国际食品展(深圳)举办同期,第24届SIAL创新大赛获奖榜单正式发布。吉丽莎(广州)贸易有限公司选送的产品诺啦格兰诺拉脆片跻身TOP10
2025-09-05 15:18:00
桃李面包广告语引争议“五仁不好吃是你还年轻”官方账号发文:领导拍的板,这个锅只能他来背
近日,桃李面包一则电梯广告文案引发争议。社交平台上流传的图片显示,桃李蛋月烧产品的广告语写道:“有人说五仁不好吃,我们认为
2025-09-05 15:29:00
京东超市布局产地直采 加大力度进口澳洲水果 助力澳洲水果深耕中国市场
今年开始,京东超市加大力度布局澳洲水果的供给和销售,投入资源帮助澳洲橙子、提子等水果进一步扩大销量。近日,在2025中国国际水果展上
2025-09-05 15:30:00
潍坊寿光市圣城街道一企业酿出康养“新食尚”
大众网记者 刘建永 潍坊报道为企赋能、助企发展是区域经济高质量发展的推动器。潍坊寿光市圣城街道在政策引领、优化营商环境
2025-09-05 15:50:00
大众网记者 王帅 通讯员 孙丽霞 杨阳 潍坊报道走进山东禾汇食品有限公司黄豆酱生产车间,一排排瓶装黄豆酱准备打包装箱,发往各大连锁商超
2025-09-05 15:50:00
9月4日,济南市委网信办联合山东省互联网传媒集团举办“‘科创泉城 智启未来’知名网络达人济南采风”活动。当日上午,10余位全国知名网络名人
2025-09-05 16:34:00