• 我的订阅
  • 科技

OpenAI推迟上线语音功能,GPT-5或要等到明年,大模型技术速度正在放缓

类别:科技 发布时间:2024-06-26 11:35:00 来源:搜狐科技

OpenAI推迟上线语音功能,GPT-5或要等到明年,大模型技术速度正在放缓

出品 | 搜狐科技

作者 | 梁昌均

大模型技术进展肉眼可见地放缓了,OpenAI此前说好的语音功能也鸽了。

OpenAI针对此前展示的高级语音功能发布最新进展称,原计划在六月底开始向少部分ChatGPT Plus用户推出alpha版本,但需要再花一个月时间才能达到发布标准。

该公司称,目前正在提升模型检测和拒绝不当内容的能力,也在改进用户体验,并在准备基础设施,以确保在扩展到数百万用户时仍能保持实时响应。

“作为迭代部署策略的一部分,我们将从少部分用户开始alpha测试,以收集反馈,并根据反馈进行改进和扩展。”OpenAI表示,计划将在秋季让所有Plus用户都能使用语音功能,具体时间表取决于是否能达到高标准的安全性和可靠性。

OpenAI提到的高级语音功能是在5月的春节发布会上对外展示,当时发布的新一代大模型GPT-4o集文本音频视觉于一身,支持文本、音频和图像的任意组合作为输入和输出,被OpenAI称为“迈向更自然的人机交互的一步”。

根据当时公布的基准测试,GPT-4o在多语言、音频和视觉功能上达到新的水平。在语音识别和翻译方面,GPT-4o相比OpenAI自己开发的语音模式Whisper-v3显著提高,在语音翻译树立了新的最先进水平。

OpenAI首席技术官穆里·穆拉提(Muri Murati)当时表示,OpenAI一直致力于让用户通过语音与ChatGPT 进行真人般地交流,但之前版本由于延迟问题,严重影响了对话的沉浸感。

“GPT-4o最大亮点在于其语音交互模式采用了新技术,从而使得人们可以用麦克风与 ChatGPT交谈,让聊天机器人对话的响应速度大幅提升。”穆拉提表示。

据介绍,GPT-4o可以在短至232毫秒的时间内响应音频输入,平均为320毫秒,这与人类在对话中的响应时间相似。它不仅可以将语音转换为文本,还具备先进的音频理解能力。

根据发布会上的演示,在提问结束后,GPT-4o几乎可以即时回应,并通过文本转语音功能进行朗读,且对话比较自然逼真。它还能感受到呼吸和情感,并可以调整控制声音或说话语义,比如发出夸张、兴奋、舒缓或机器人的声音。

OpenAI CEO奥特曼表示,GPT-4o提供新的语音和视频模式,是其用过的最好的计算机界面。“事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化,能够使用计算机做比以往更多的事情。”

不过,当时OpenAI并未立马上线GPT-4o的语音功能,并表示它会带来新的安全风险,且仍存在局限性。但经过一个多月的优化后,这项语音功能依然并未达到预期。

“ChatGPT的高级语音模式能够理解并带有情感和非语言提示的回应,从而实现更接近与AI进行实时、自然对话,我们的使命是深思熟虑地将这些新体验带给您。”OpenAI称。

OpenAI在最近进展中还透露,目前也在推进之前单独展示的视频和屏幕共享功能,并会及时通知更新。

此外,OpenAI还宣布ChatGPT Mac端正式推出,实现ChatGPT与用户工作流、写作和创作方式集成。此前,苹果已与OpenAI达成合作,ChatGPT将在云端响应苹果用户需求。

目前,OpenAI正面临谷歌、Anthropic等对手的贴身追赶,后者最新发布的Claude 3.5 Sonnet在逻辑推理、数学编程等方面的性能均超越GPT-4o,但这款模型并未加入语音功能。

因此,某种程度来看,GPT-4o在语音方面仍保持领先。但OpenAI推迟上线语音功能,则显示出,尽管是目前依然最为领先的大模型企业,但技术进步也在放缓,这背后可能涉及到数据版权、算力等问题,以及监管之下AI内容安全变得越发重要。

前不久,美国知名女演员斯嘉丽·约翰逊就针对ChatGPT使用酷似她的语音一事提出质疑,并向OpenAI发出律师函。OpenAI虽然并未承认违规使用,但还是下架了该语音。

实际上,OpenAI在研发新一代的模型的步伐也已经放缓,业界预期GPT-5原本应该在今年夏季发布,但目前OpenAI还未给出时间表,此前展示的Sora也依然未对外开放。

穆拉提在最近的一次采访表示,AI系统在特定任务中已经达到人类水平,GPT-3类似婴儿水平的智能,GPT-4则进化到更像一个高中生,OpenAI接下来将致力于研究达到博士级别的智能,也许就在一年或一年半之后实现。

外界认为,这款模型可能就是OpenAI目前正在研发的GPT-5,按照前述预期,其有望在2025年底或2026年初推出。

此前有爆料称,GPT-5将是具有52万亿参数的多模态模型,意味着其复杂性和性能将有显著提升。但这可能也会面临更大的技术和工程难度,时间成本也会更高。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-26 15:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

手机厂商集体奔向大模型,但应用场景仍局限于语音助手?
...的大模型在手机上跑通了。与此同时,升级大模型的小米语音助手小爱同学也开启内测,提供超级问答、个性化创作、上下文理解与复杂任务处理等一系列的能力。在前不久的华为开发者大会上,华
2023-08-18 22:01:00
Meta发布生成式AI语音模型Voicebox,精通六种语言,支持多种语音功能 | 最前线
作者 | 周愚 编辑 | 邓咏仪美国时间6月16日,Meta正式发布语音生成模型Voicebox。据官网介绍,通过非自回归“流匹配”(Flow Matching)技术
2023-06-19 17:10:00
苹果的 AI 宏图,用 iPad 当前菜
...人不知道,Siri是“SpeechInterpretation&RecognitionInterface(语音解释和识别接口)”
2024-05-12 16:16:00
十多年来最重要的一次!库克会暗掷“王炸”吗?
...门用于处理人工智能任务,并能提高速度,或者让公司的语音助手Siri更深入地嵌入应用程序以帮助用户执行任务。更大的期待来自于苹果是否会在WWDC上与OpenAI联手“出大招”。
2024-06-11 09:00:00
AI视野:iPhone16将引入生成式AI;百度AI编程工具限时免费;
...男友、科研利器等多领域,刷新增长速度。AI大模型通过语音检测2型糖尿病,准确率惊人!这项加拿大Klick科研成果发布了一款AI大模型
2023-11-13 16:52:00
openai语音翻译又出新功能了!
听说了吗?OpenAI又出新了!他们正在推出ChatGPT的全新语音和图像功能,提供了一种全新、更直观的交互方式,通过语音对话或以图片形式向ChatGPT展示讨论的内容
2023-09-26 14:59:00
基本盘越来越扎实,科大讯飞借助AI大模型跑出“加速度”
...飞,也如同一位意气风发的“青年人”,依靠早年在智能语音技术的积累,以及在AI大模型赛道的前瞻性布局,站在了时代的潮头。据媒体报道,在科大讯飞成立25周年之际,科大讯飞董事长刘
2024-06-17 09:35:00
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...圆表示,随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术
2024-10-14 01:53:00
OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了
GPT-4o的高级语音功能,终于不再是“期货”了!智东西7月31日消息,今天凌晨,OpenAI宣布开始向一小部分ChatGPT Plus用户推出高级语音模式
2024-08-01 09:32:00
更多关于科技的资讯:
【宅男财经|专家面对面】人工智能全面融入人类的生活,还有多久能够实现?工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 16:52:00
《科学智能生态报告》于腾冲科学家论坛发布——我国科学智能生态培育取得6项进展
12月5日至8日,由云南省人民政府和中国科学技术协会共同主办的2025腾冲科学家论坛在腾冲举行。论坛期间上海财经大学数字经济研究院与新华网融媒体未来研究院在“未来之问”可持续发展
2025-12-16 15:20:00
6.5折、每日5张!第九届雪博会优惠力度拉满了
12月18日至22日,第九届吉林冰雪产业国际博览会将在长春东北亚国际博览中心盛大启幕,以“购物最低享6.5折+1亿元冰雪消费券+企业特惠”等多重福利组合拳
2025-12-16 16:06:00
借势“疯狂动物城”热潮,叮当快药携手百多邦开启家庭健康新“城”事
伴随动画电影《疯狂动物城2》11月26日起全球热映,叮当健康旗下专业送药平台叮当快药与皮肤健康专业品牌百多邦,开展了一场覆盖线上线下的深度跨界合作
2025-12-16 14:03:00
从濒临倒闭到业绩暴增!“沸点计划”成功模型引爆区域代理签约潮
“沸点计划”上海合生汇店以一组硬核数据印证了其商业模型的爆发力:单日营业额最高突破6万元,平均翻台率稳定在5轮,远超行业平均水平
2025-12-16 14:04:00
中国消费者报南宁讯(杨霞 记者顾艳伟)知识产权纠纷曾是不少“出海”企业面临的难题。12月12日,记者从广西壮族自治区桂林市市场监管局了解到
2025-12-16 11:07:00
河北沧州:一张操作指南卡破解企业信息填报难题
中国消费者报石家庄讯(谭鑫 记者李建)记者近日从河北省沧州市标准化所获悉,今年以来,该所紧扣行风建设,以“群众易懂、流程畅通
2025-12-16 11:07:00
江苏省消保委调查货运平台发现:价格不透明、信息掺水、服务保障差等乱象突出
中国消费者报报道(记者薛晶晶)随着网络货运市场规模持续扩容,相关平台已成为货主发货、司机找活的核心渠道,但其背后的乱象也让消费者苦不堪言
2025-12-16 11:07:00
中国消费者报报道(记者李燕京)12月8日,《疯狂动物城2》在中国内地的票房突破30亿元。数据显示,截至11月30日,2025年度国产片票房已达403
2025-12-16 11:07:00
中国消费者报报道(记者桑雪骐)中央经济工作会议12月10日至11日在北京举行。在部署明年重点任务时,会议提到了“优化‘两新’政策实施”
2025-12-16 11:07:00
海尔集团与歌尔集团达成战略合作,新时达将助力歌尔深化智能制造领域布局
12月11日,海尔集团与歌尔集团正式签署战略合作协议,双方将聚焦智能家电、工业互联网、新能源及人工智能等领域展开深度合作
2025-12-16 11:33:00
于琛刚刚过去的这个“双十二”,除了各电商平台推出的促销活动,抖音出台严打“假揭黑真带货”等违规行为的多项举措,也成为人们热议的话题
2025-12-16 11:02:00
近日,全国首家“现代骑手学院”正式揭牌,该学院设在广州职业技术大学,为在职外卖骑手和快递员提供学历和技能“双提升”通道
2025-12-16 08:07:00
12月12日“双十二”购物节当天,西湖区黄龙国际中心K-lab广场人气高涨,“疯狂碰友日·西湖首发季”2025西湖区新消费活动在此启动
2025-12-16 08:30:00
为加快培养适应人工智能时代发展需求的高水平创新人才,10月底,《浙江省中小学人工智能通识教育指导意见》发布。此前,杭州将人工智能通识课程纳入中小学各学段地方课程
2025-12-16 08:31:00