• 我的订阅
  • 科技

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

类别:科技 发布时间:2024-08-01 09:32:00 来源:智东西

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

GPT-4o的高级语音功能,终于不再是“期货”了!

智东西7月31日消息,今天凌晨,OpenAI宣布开始向一小部分ChatGPT Plus用户推出高级语音模式,基于GPT-4o提供更自然的实时对话。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

▲OpenAI上线高级语音模式

该模式上线后,不少收到邀请的网友已经玩起来了,并分享了自己试用的视频和感受。例如这是一段由ChatGPT献上的快嘴Rap和Beatbox,听起来还挺有模有样的。

总的来看,ChatGPT的高级语音模式与当初官方的演示差别并不大,几乎没有时延,各种语气也十分生动。不过其似乎在安全方面做了很多防护措施,ChatGPT拒绝用户请求的几率变高了。

ChatGPT的语音对话功能于去年9月首次推出。今年5月,OpenAI推出基于旗舰模型GPT-4o的更高级语音对话版,并进行了公开演示。GPT-4o使用单个多模态模型,而不是之前的三个独立模型来实现语音功能,从而降低了与聊天机器人对话的延迟。(OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了)

当时,OpenAI宣称该功能将在几周内陆续向免费和付费用户推出。但发布没几天,OpenAI就因演示中的ChatGPT声音,与《复仇者联盟》系列电影中“黑寡妇”扮演者、被影迷称为“寡姐”的斯嘉丽·约翰逊(Scarlett Johansson)声线过于相似,而遭到斯嘉丽本人的控诉和网友的强烈反对。

高级语音模式的发布日期也因此被推迟。尽管OpenAI坚称ChatGPT并没有模仿斯嘉丽的声音,但该声线后来还是被删除了。

一、百余外部红队成员测试,秋季或开放至全部订阅用户

基于GPT-4o的高级语音模式目前仅向小部分ChatGPT Plus用户推出,可提供更自然的实时对话,允许用户随时打断,并能感知和响应用户情绪。

参与此Alpha测试的用户将收到一封包含说明的电子邮件,并在其ChatGPT手机端App中收到通知。OpenAI称,后续将继续滚动添加更多用户,并计划在秋季让每一个Plus订阅用户上都能使用。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

▲邀请邮件和App主页面

ChatGPT的高级语音模式于今年5月发布,其基于OpenAI全新旗舰模型GPT-4o,可以进行语音聊天和实时视频交互,比如通过视频影像理解线性方程、通过人的表情和语调理解并判断出人的情绪等。

OpenAI称,自首次发布以来,团队一直致力于加强语音对话的安全性和质量,与45种语言的100多名外部红队成员一起测试了语音功能。

为了保护隐私,OpenAI在训练模型时只用四种预设的声音说话,并构建了相应的系统来屏蔽与不同的输出,还采取了防护措施来屏蔽对暴力或版权内容的请求。

OpenAI计划在8月初,分享一份关于GPT-4o的功能、局限性和安全评估的详细报告。

二、第一波试用者开始整活了:练法语、学猫叫、解说足球

第一波试用者已经迫不及待地用上高级语音模式,并分享了自己试用体验。

艺术家Manuel Sainsily打开摄像头,一边实时拍摄自己的刚养的小猫和为其布置的环境,一边询问ChatGPT关于喂养的意见。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

ChatGPT的回应基本没有任何延迟,先是用非常宠爱的语气称赞了猫咪的可爱,随后在询问了更多信息后安慰Sainsily,告诉他不用担心。Sainsily感慨道:“这感觉就像与一位知识渊博的朋友进行视频通话。”

网友Bergara在社交平台Reddit分享道,ChatGPT拒绝了他所有的唱歌请求,也不愿意改变声线。当他让ChatGPT以不同的方式和情绪背诵一首诗歌时成功了,但要求它笑着背诵这首诗时,它拒绝了。

例如,Bergara称自己正在练习法语,让ChatGPT充当语言教练,询问其关于发音的意见。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

针对Bergara的单词发音,ChatGPT详细地给出了关于重音、尾音等的建议,并做了示范。同时其在教学风格上非常“鼓励式教育”,毫不吝啬地夸奖Bergara的发音,情绪价值直接拉满。

Bergara又让ChaGPT分别用害羞、生气的语气讲关于啤酒的笑话。ChatGPT对害羞的理解是用气声发音,在表达生气时则提高了自己的分贝。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

当ChatGPT被要求用悲伤的语气朗诵诗歌时,它听起来快要碎了……

Bergara称,到目前为止的测试里,ChatGPT表现出的样子和OpenAI所展示的差不多,但拒绝率似乎有点高,他推测可能是出于安全原因。

例如,当Bergara要求ChatGPT用歌声讲一个关于机器人和爱的故事,它称自己可以讲故事,但只能用平常说话的语气。

在ChatGPT讲故事的过程中,Bergara多次打断并要求它“加入更多感情”。ChatGPT照做了,其语气变得更加缓慢和生动。

还有的网友已经开始用ChatGPT整活了。

Squad联合创始人、首席技术官Ethan Sutin让ChatGPT模仿了各种各样的猫叫。不得不说这猫叫有些“魔性”,但似乎还挺真实的,因为我家猫被吸引过来了……

ChatGPT似乎还具备音乐演奏的能力。Sutin让其演奏一个C小调和弦,有没有懂乐理的读者朋友来听一下是否准确?

网友Cristiano Giardina让ChatGPT扮演起了足球比赛评论员。他分享了试用高级语音模式的一些初步印象:速度非常快,总是会产生有趣的结果,在说其他语言时总是带有美国口音。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

网友Kesku让ChatGPT说一种不存在的语言,然后解释这种语言是如何运作的。ChatGPT创造了一种基于声音的语言Glimnar,听起来有点像吟唱。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

尽管现在用上ChatGPT高级语音模式的用户还是少数,但随着其推送范围的扩大,也许我们能看到更多有趣的玩法和体验。

结语:OpenAI提高对AI安全的重视

AI在语音、视频方面,正在因为其充当欺诈工具的能力受到审查。尽管OpenAI的语音模式目前不允许生成新的声线或语音克隆,但该模式仍然可能会给人带来混淆。

在春季更新后的几个月里,OpenAI发布了一系列关于安全性和AI模型对齐的新论文。在此之前,其超级对齐团队已经解散,一些前任和现任员工批评其将重点转移到发布新产品而不是安全性上。目前来看,高级语音模式的推出放缓似乎是在向用户、监管机构和立法者表明OpenAI对安全的重视。

ChatGPT高级语音模式的发布也使OpenAI进一步与Meta的Llama 3.1模型、Anthropic的Claude 3等竞争对手区分开,给专注于情感语音的AI初创公司带来压力

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-01 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微信更新后 不用解锁手机 也能接听语音了
...整合进 iOS 系统里。比如微信接入 CallKit 后,别人给你打语音电话,你可以像接系统电话一样,无需打开微信
2025-01-24 00:33:00
ChatGPT连夜登陆iOS 免费无广告、还支持语音
...验。一手体验:用户交互简洁、模拟真人对话,还能支持语音输入整体来说,移动端的ChatGPT主打简洁流畅的风格,全力提供一个友好顺畅的聊天体验。下载后,首先会出现一个简单的开屏
2023-05-19 21:10:00
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
...「Her」还是期货,但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级版Siri
2024-09-10 13:38:00
新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式
...称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式,甚至可能是直接正式发布
2024-09-20 13:31:00
微软moment5更新:语音访问新增功能
...供了诸多更改,但对于大部分人来说可能没有太大需求:语音访问新增功能!现在可以使用以下语言使用语音访问:法语(法国、加拿大)德语西班牙语(西班牙、墨西哥)当你第一次打开语音访问
2024-03-02 01:55:00
电视一不注意就更新,越更新越卡顿,这些问题该如何解决?
...使用过程中却并不友好。软件频繁更新,电视越来越卡,语音功能也难“听懂”用户指令……花费大几千甚至上万元购买的智能电视,为什么让人不省心?这些问题又该如何解决?电视一不注意就更
2024-09-14 02:47:00
微信接不到视频和语音的六大原因
微信接不到视频和语音是一个比较常见的问题,导致微信无法接收视频和语音通话的主要原因,包括网络问题、微信版本过旧、手机设置问题、设备问题、微信账号问题、软件冲突以及微信服务器故障。
2024-07-06 14:48:00
雪佛兰创酷rs新增四种语音模式、更新六大场景
...消息,雪佛兰创酷RS汽车日前迎来OTA远程升级,新增四种语音模式、更新六大场景,涵盖智能语音模式、应用商店App、系统设置等。据介绍,新增四种智能语音模式,分别为螺狮粉模式、
2023-11-13 14:00:00
微信引用回复功能更新:可以回语音表情包了
...的消息,微信引用回复功能更新,现在可以引用表情包和语音进行回复,同时回复内容也不受限于文字,可以回复语音和表情包了。需要注意的是,当使用安卓系统的手机,分别向iOS系统与安卓
2025-04-03 16:11:00
更多关于科技的资讯:
12月,王力宏成都演唱会上,六台银色机器人伴随音乐节拍整齐划一地挥臂、踢腿、转身,然后在歌曲高潮段落完成一组高难度空翻
2025-12-31 08:08:00
今年以来,邮储银行济南市分行紧紧围绕小微企业和实体经济发展需求,以金融服务精准赋能区域市场主体,通过“产品攻坚+服务深耕”双轮驱动模式
2025-12-31 08:20:00
好哒与尚米店双强联动 数字化服务赋能实体经营新发展
2025年12月17日,深耕商户服务的标杆平台好哒与专注零售餐饮数字化领域的尚米店军师正式达成深度战略合作。此次双方强强联合
2025-12-31 08:22:00
2025 中国科技创新观察:引领全球、赋能产业、普惠民生
即将结束的2025年,无疑是“中国创造”引爆全球的里程碑。伴舞机器人的爆火并不是孤例。这一年,中国的科技创新不再局限于“卡脖子” 技术的单点突破
2025-12-31 08:26:00
浙江日报杭州12月30日讯 (记者 谢丹颖) 记者30日从天目山实验室获悉,实验室研制的600公斤级智能重载无人直升机日前首飞成功
2025-12-31 09:09:00
河南“智”造,“味”你而来丨了不起的河南智造②
【编者按】当厚重中原遇上智慧创新,会擦出怎样的火花?黄河之畔,钢铁与芯片共舞,机械臂与大数据齐鸣,一场“智造交响曲 ”正在上演
2025-12-31 09:14:00
鲁网12月31日讯近日,崂山区召开“产业链上的崂山好品牌”系列现场媒体见面会——智能家电产业链专场,记者从会上了解到,崂山区围绕智能服务型家电与可穿戴智能设备两大赛道
2025-12-31 10:49:00
在鲁西平原的坐标系里,一场关于发展的青春演算正在进行。当“00后”创业者用代码重构传统工厂,当返乡青年用直播间刷新农产品产值
2025-12-31 09:34:00
近期,工业和信息化部成立人形机器人与具身智能标准化技术委员会(下称“标委会”)。标委会的成立是发挥标准引领作用,加强高质量标准供给
2025-12-31 10:15:00
为建设“人工智能第一城”注入新动能杭州日报讯 杭州正加快构建场景驱动的AI产业基金,为人工智能产业发展注入全新动力。近日
2025-12-31 07:07:00
单个项目最高补助5000万元每日商报讯 用“意念”操控机械臂帮助瘫痪患者重获行动能力,以人脑为蓝本打造超低功耗芯片处理复杂任务……这些曾只存在于科幻作品中的场景
2025-12-31 07:37:00
日复一日,年复一年,新年的脚步已悄然叩响门环,无论你我是否整理好行囊。这一年的时光,有多少已从指缝间不经意溜走——被闹钟唤醒的清晨
2025-12-31 07:38:00
“现代化城市雄安探路”系列报道(五):数字孪生 创新之城
数字孪生 创新之城——“现代化城市雄安探路”系列报道⑤日前拍摄的雄安城市计算中心。它是雄安数字城市建设的核心枢纽。 河北日报记者 刘光昱摄建筑通过数字建模
2025-12-31 07:42:00
■王鑫摘要:在数字化转型的背景下,企业财务管理正面临由传统核算型向智能决策型的系统性变革。本文从数字化发展的实际需求出发
2025-12-31 04:48:00
1元租机器人,线下开首店:人形机器人打响大众化“发令枪”
大皖新闻讯 2025年的最后两天,中国的人形机器人产业以两件标志性事件,为即将到来的2026年按下了商业化加速键。一边是擎天租以“1元闪租”的体验价格将可以“打太极”的人形机器人推向大众市场
2025-12-30 21:48:00