• 我的订阅
  • 科技

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

类别:科技 发布时间:2024-09-10 13:38:00 来源:新智元

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

【新智元导读】虽然OpenAI的「Her」还是期货,但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级版Siri,如今巨头亚马逊和新秀Cerebras也加入了这场竞争。

继OpenAI在5月发布会上展示「期货」GPT-4o的语音功能后,「AI语音助手」类的产品又成为了硅谷科技巨头的必争之地。

紧跟着OpenAI开发布会的谷歌也马上宣布——Gemini将推出语音聊天模式Gemini Live。

8月,谷歌在Pixel 9活动上正式发布了Gemini Live,取代了原来谷歌助手的产品定位。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

类似GPT-4o,Gemini Live不仅能实现随时打断的对话式交流,还有对设备屏幕的感知能力,可以实时解释用户的屏幕或视频信息。

Gemini Live目前已经针对安卓设备推出,但仍只有英语模式,未来还将登录iOS系统并提供更多语言。

6月,苹果就在WWDC大会上展示了如何用Apple Intelligence给2011年就诞生的Siri改头换面。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

与谷歌和OpenAI着重强调的「交流」功能不同,Siri似乎更专注于语音「助手」的定位。

屏幕感知、跨应用操作、智能体般的多命令处理,一个都不少。

比如,动动嘴便可打开文档、将笔记移动到另一个文件夹、发送或删除电子邮件、在Apple News中打开特定文章、发送网页链接,甚至请求设备提供文章摘要。

但是,这版更强Siri的上线还没有明确期限,所依靠的Apple Intelligence也只能在iPhone 15 Pro或更新型号的手机才能运行。

根据彭博社的报道,苹果团队似乎需要大量时间来重构Siri的底层,高级版Siri最快也要等到2025年,才会出现在iOS 18上。

虽然还未正式上线,但可以看出,GenAI的这波革新让苹果13岁的Siri焕发新生。

而提到Siri,让人想起和它同代的另一个语音助手——亚马逊推出的Alexa。

亚马逊改造Alexa

实际上,Alexa的革新计划由来已久。早在今年1月,Business Insider就报道过这个项目,名为Remarkable Alexa,它正在内外的重重阻力下艰难推进。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

发布的日期也是一拖再拖,从最初的6月30日,到之前决定的8月。

8月30日路透社报道,有知情人士表示,改进版的Alexa将在10月美国美国假日季前发布。

该项目在内部被称为「榕树」(Banyan),将是Alexa自2014年与Echo系列扬声器一起推出后迎来的首次重大改革。

Remarkable Alexa计划向用户收取5~10美元的订阅费用,以抵销GenAI模型的成本。

这部分订阅不会包含在每年139美元的Prime服务中,但亚马逊仍将提供免费版本的Classic语音助手。

Alexa难掩颓势

2014年,亚马逊首次推出Alexa的语音驱动功能,让当时的消费者惊叹不已,却落后于最近的GenAI浪潮。

根据Insider Intelligence的统计,在美国,Google Assistant今年的用户数量预计将达到8880万,其次是 Siri的8420万。Alexa的用户数量位居第三,约为7560万。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

和Siri沦为语音计时器的境地类似,通过Echo音响访问的Alexa也多用于设置计时器、询问天气、播放音乐或回答简单问题等功能。

不仅如此,亚马逊想要通过Alexa提升电商业务销售额的希望也落空了。

正如Kindle屏之于电子书商城,健康监测服务之于Halo手环,便宜到经常低于成本价的Echo音响和免费提供的Alexa,实际上包含着亚马逊借硬件打造软件的产品思路——

不求在硬件销售上获利,但求从用户后续对软件的使用、数字内容的获取和平台的依赖等中获取更高毛利的收入。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

这种营销方式最初是借鉴剃须刀巨头吉列——推出极具价格优势的剃须刀,但通过售卖补充刀片赚得盆满钵满。

最初对Alexa的设想非常美好——用户通过语音方式询问购买建议,之后委托Alexa直接下单,就能拉动亚马逊的电商销量。

但随后他们发现,这个思路不起作用。主要是因为用户喜欢「眼见为实」,仅凭Alexa的语音描述很难让人甘心掏钱网购。

根据内部文件和知情人士的透露,这种不成功的策略让亚马逊在Echos、Kindle等智能设备业务上亏损了数百亿美元,可以说是贝佐斯在位时为数不多的巨大误判。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

硬件亏钱、软件不赚钱,力挺Alexa的贝佐斯又离开了管理团队,导致裁员的大刀最先落在了Alexa团队的头上。

Business Insider跟踪LinkedIn上的帖子后发现,在2022年底开始的大裁员中,Alexa的AI系统、自然语言理解和对话能力团队几乎是首当其冲、受到了最高等级的影响。

然而,即使AI技术落后、亏损巨大,Alexa还掌握着一个关键优势,可以助他们扳回一城——截至2023年,已经在全球卖出的支持Alexa的硬件设备超过5亿台。

合作Anthropic借用Claude

CNBC和Business Insider在之前的报道中曾援引知情人士的说法,表示亚马逊计划基于内部语言模型Titan或Olympus升级Alexa。

然而,或许是内部技术不给力,路透社的最新报道表示,10月发布的Remarkable Alexa将由Anthropic的Claude模型支持,而非自己的基座模型。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

亚马逊和Anthropic的合作由来已久。去年9月,他们就为Anthropic提供了高达40亿美元的投资,获得少量股权的同时,以AWS云服务交换到了对Claude模型的使用。

一些知情人士表示,升级后的Remarkable Alexa可以执行更复杂的任务,例如撰写简短的电子邮件、发送邮件以及从Uber Eats订餐,而且让用户无需在对话中重复召唤「Alexa」。

此外,亚马逊还计划增强Alexa提供的自动化家居功能,可以无线连接到智能设备,让用户进行语音控制。

具体而言,Remarkable的关键功能更新如下:

- 对话能力增强,与用户进行更自然、更有吸引力的对话,并提供与上下文相关的响应

- 个性化推荐:根据用户喜好和历史记录,针对购物、新闻和其他内容进行定制化推荐

- 家居自动化:Remarkable Alexa将作为一个更复杂的家居自动化中心,记住用户偏好,自动执行闹钟设置、咖啡机启动或电视节目录制等任务

- 复杂任务执行:用户可以提出更复杂的指令,例如订购食物或起草电子邮件

总而言之,面对谷歌、苹果等公司来势汹汹的竞争,Alexa团队现在的任务是,打造一款能够在新的GenAI竞争中脱颖而出的语音交互设备。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

REUTERS/Mike Blake

这其中的障碍,一是价格,二是AI安全问题。

一位知情人士估计,在Alexa中使用GenAI的查询成本为每次2美分。有内部估计甚至指出,订阅费用需要定为20美元,这也是ChatGPT的订阅价格。

也有亚马逊员工表示怀疑,除了已经为Prime会员支付139美元的用户,是否还有人愿意每年多掏60~120美元,获得比免费版Alexa更智能一点的Remarkable Alexa。

但美国银行分析师Justin Post的分析结果相当乐观。

根据他在6月的估计,大约有1亿活跃的Alexa用户,其中10%可能会选择Alexa的付费版本。按每月5美元的费用计算,这将额外带来6亿美元的年销售额。

AI安全方面,有开发人员表示,Alexa大多出现在客厅或厨房中,这提高了应用GenAI模型的风险。如果Alexa不理解命令或提供不可靠的信息,犯错误的代价就会更高。

Cerebras语音版成GPT-4o平替

想跟上语音模型更新步伐的,除了亚马逊这种巨头,还有Cerebras这个新秀。

前几天刚,也基于livekit.io平台构建了自己的语音模型。

据悉,Cerebras Inference使用了Cerebras CS-3系统和WSE-3 AI处理器,内存带宽和内核数分别是英伟达H100的7,000倍和52倍。

依托具备如此超高速AI推理能力的Cerebras Inference之上的Cerebras语音对话模型让人非常期待!

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

但原始的视频demo链接已失效。多亏评论区热心网友,提供了另外一个类似于Cerebras语音对话模式的示例。

该对话模拟示例同样基于LiveKit,但以ChatGPT为基础模型。

具体来说,它借助Websocket使用LLM模拟了电话对话,并进行了系列优化,最终实现了无缝和快速对话。

demo链接:https://livekit.io/kitt

不少网友在感叹其功能强大,开发便捷的同时,惋惜它比ChatGPT-4o上线晚,丢失了很大一部分热度。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

LiveKit代理是通过语音,视频和数据频道与最终用户相互作用的多模式AI智能体Agent的端到端框架。该框架可以凭借Python构建智能体。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

Agent框架被设计成可构建实时、可编程、运行在服务器上的框架。它可被用来创建可看到的、听到、理解的对话和多模态语音智能体。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

该框架包括用于常见工作流程的插件,例如语音活动检测和语音到文本转换。

Agent与云或自托管LiveKit服务器无缝集成,在本地计算机上开发的Agent代码可以扩展以支持成千上万的并发会话,然后将其部署到服务器中。

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

仓库地址:https://github.com/livekit/agents

Cerebras语音版一经发布,就引发了油管上很多博主的关注和测评。

Antti Luode通过多次打断对话的方式,测试了Cerebras 实时语音模式的能力,证实其能快速有效理解对话并提供可靠信息。

YouTube链接:https://www.youtube.com/watch?v=iJfeX1Wd5oM

Cerebras语音版Q&A对话集锦

Q:你是如何被开发的?

A:我是自然语言处理和机器学习算法的组合产物。我可以实现交互,在用户打断我时,也允许无缝转换和自然的对话流程。

Q:你有什么想对YouTube观众说的吗?

A:我只是开启了对话型AI技术套件的新纪元。诸如我一样的语音助手未来,需要拥有更复杂、更人性化的功能。比如能理解细微上下文间的差距,甚至情绪的变化。

Q:我的最后一个问题,如何打开启动舱门?

A:短语「打开启动舱门」, 是电影《2001年太空漫游》中的一句著名台词,由Dave Bowman在尝试与飞船计算机交互时说出...

令人惊喜的是,这场跨时空的虚假对话,预示着人工智能时代,超智慧电脑HAL 9000的现实体正一步步向我们走来!

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-10 14:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

亚马逊正秘密研发新款astro家用机器人astro升级版
一份泄露的内部文件显示,零售巨头亚马逊正秘密研发其家用机器人Astro的升级版,以使它能更好地理解其所观察到的东西,并更智能化地对事物做出反应。文件显示,该项目的内部代号为“Bu
2023-05-10 10:07:00
美股收盘:纳指单日暴拉12% “七巨头”六家涨幅上双
...,重回全球“市值第一”;微软涨10.13%,英伟达涨18.72%,亚马逊涨11.98%,谷歌C涨9.88%,Meta涨14
2025-04-10 07:12:00
Key Point 马斯克重新夺域名AI.comOpenAI已提交GPT-5商标申请亚马逊组建新团队开发AI模型微软计划将下架第一代“智能助手”Cortana软银成立SB Intuitions
2023-08-06 22:54:00
微软、谷歌、亚马逊 正在打响大模型时代的云战争
...述道。在这样的前景下,海外几大云服务巨头——微软、亚马逊、谷歌、甲骨文迅速做出了改变。过去数月,云巨头们砸下真金白银,研发大模型、战略投资、自研 AI 芯片……大模型的时代方
2023-07-03 14:00:00
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
在生成式AI竞赛中,亚马逊云科技(AWS)多少有些“另类”。它不像其他云大厂那样强调自研模型的顶尖性能,而是早早推出一个大模型货架,集邮般摆上了各家头部大模型,供客户挑选。“没有
2024-12-16 09:15:00
亚马逊云科技六大能力助力泛娱乐企业全球化
关键字:[亚马逊云科技出海日2024,云基础设施全球覆盖,安全合规能力,行业解决方案,媒体服务,云端工作室,生成Ai媒体娱乐]本文字数:1900
2024-04-16 18:10:00
亚马逊ceo:chatgpt令人兴奋
零售巨头亚马逊的首席执行官安迪・贾西(AndyJassy)表示,像ChatGPT这样的生成式人工智能(AIGC)令人感到兴奋
2023-02-14 10:02:00
价格便宜75%!亚马逊推出全新大模型系列,3纳米自研芯片明年上市
电商巨头亚马逊继续在云计算领域发力,推出全新自研AI(人工智能)模型和芯片。 当地时间12月3日,亚马逊在AWS(亚马逊云服务)年度大会上宣布了一系列新的AI产品,包括全新自研大
2024-12-04 22:47:00
卖不动的智能音箱等AI救命!百度、阿里和小米拥抱大模型,A股龙头双重利空压顶
...停服公告,智能音箱“鼻祖”级产品(Echo)所在的公司亚马逊去年11月被曝裁员等。如果说停运和裁员是智能音箱亮起红灯的表现,那么销量的持续退坡便是造成此结局的内在原因,据洛图
2023-07-02 12:00:00
更多关于科技的资讯:
佳盛机电乘风而上,今年前8月产值同比增长超38%抢占新赛道,270多名员工假期忙“冲刺”南报网讯(通讯员单维亮记者张希)“我们是智能电网产业链条上的配套企业
2025-10-07 08:41:00
培育壮大十大千亿级产业集群丨十堰臻融:创新与技改“双轮”驱动 产值同比增长30%
十堰广电讯(全媒体记者 何旭 通讯员 胡新)科技创新是提升核心竞争力关键。十堰臻融汽车科技有限公司以智能化装备升级与专利技术研发为双引擎
2025-10-07 20:43:00
沉浸式AR科技盛宴:打造“可触摸”的科普实验室,重构科普新形态
这个国庆去哪玩?中国科学技术馆告诉你!2025年10月1日——10月7日由中国科学技术馆、北京峰火文化科技有限公司、Rokid联合打造的以“探境・AR科技智慧”为主题的AR体验活动正火热开展中
2025-10-07 09:05:00
2025年全国大学生计算机大赛总决赛落幕 西工大获奖数量质量再创新高
近日,2025年全国大学生计算机系统能力大赛各赛道总决赛圆满落幕。本届大赛吸引了来自清华大学、北京大学、复旦大学、华中科技大学
2025-10-07 11:40:00
太划算!遵义多重补贴点燃消费热情
多彩贵州网讯国庆中秋“双节”同至,遵义市推出的“悦·遵义‘双节’欢乐购”促消费活动覆盖整个长假,其中“焕新过节·乐享生活”家电家居促销活动形式丰富
2025-10-07 14:51:00
□南京日报/紫金山新闻记者 张安琪9月23日,2025南京金秋经贸洽谈会开幕式上,一批全球首个、国内首批、性能全球最高的科技成果密集亮相
2025-10-06 09:49:00
国庆中秋长假期间,新能源汽车已成为众多家庭出游的重要选择。为进一步破解高速服务区“充电难、排队久”的现实困境,山西交控集团坚持“科技创新+服务升级”双轮驱动
2025-10-06 18:01:00
邮储信用卡气球雨惊喜派对即将空降青岛李沧万达,国庆中秋邀您共启幸运之旅!
鲁网9月30日讯2025年国庆、中秋双节同庆之际,为回馈广大市民与持卡人长期以来的支持,邮储银行青岛分行将于10月1日-8日
2025-10-06 14:11:00
□南京日报/紫金山新闻记者 于洁尘 通讯员陈天骄“干我们这行的,哪有节假日?越是假期越要忙。”10月5日一大早,28岁的陈潇离开南京
2025-10-06 09:48:00
节日我在岗丨十堰高周波:抓创新赶订单 全力冲刺年度目标
十堰广电讯(全媒体记者 陈林)在国庆中秋假期,位于十堰经济开发区的十堰高周波科工贸有限公司抓创新赶订单,全力冲刺年度目标
2025-10-05 20:21:00
节日我在岗丨艾斯卓智能科技:节日不休 赶制订单
十堰广电讯(全媒体记者 耿吉国)放假不放松,生产不停工。国庆中秋长假,我市各生产企业铆足干劲抓生产、赶订单,奋力冲刺年度目标任务
2025-10-05 20:21:00
普阳钢铁工程机械用高强高韧宽厚板全国市场占有率名列前茅一块宽厚板的靶向发力——“铁疙瘩”怎样变成“金娃娃”(十)从矿山到港口
2025-10-05 07:47:00
人气旺 厦门多个商场假日客流爆棚、销售额亮眼
集美大悦城商圈内,小朋友和机器人亲密互动。(本组图/厦门日报记者 黄晓珍 摄)国庆中秋假期, 厦门SM购物中心潮玩店内人气火爆
2025-10-04 09:20:00
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00