• 我的订阅
  • 科技

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

类别:科技 发布时间:2024-08-01 09:32:00 来源:智东西

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

GPT-4o的高级语音功能,终于不再是“期货”了!

智东西7月31日消息,今天凌晨,OpenAI宣布开始向一小部分ChatGPT Plus用户推出高级语音模式,基于GPT-4o提供更自然的实时对话。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

▲OpenAI上线高级语音模式

该模式上线后,不少收到邀请的网友已经玩起来了,并分享了自己试用的视频和感受。例如这是一段由ChatGPT献上的快嘴Rap和Beatbox,听起来还挺有模有样的。

总的来看,ChatGPT的高级语音模式与当初官方的演示差别并不大,几乎没有时延,各种语气也十分生动。不过其似乎在安全方面做了很多防护措施,ChatGPT拒绝用户请求的几率变高了。

ChatGPT的语音对话功能于去年9月首次推出。今年5月,OpenAI推出基于旗舰模型GPT-4o的更高级语音对话版,并进行了公开演示。GPT-4o使用单个多模态模型,而不是之前的三个独立模型来实现语音功能,从而降低了与聊天机器人对话的延迟。(OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了)

当时,OpenAI宣称该功能将在几周内陆续向免费和付费用户推出。但发布没几天,OpenAI就因演示中的ChatGPT声音,与《复仇者联盟》系列电影中“黑寡妇”扮演者、被影迷称为“寡姐”的斯嘉丽·约翰逊(Scarlett Johansson)声线过于相似,而遭到斯嘉丽本人的控诉和网友的强烈反对。

高级语音模式的发布日期也因此被推迟。尽管OpenAI坚称ChatGPT并没有模仿斯嘉丽的声音,但该声线后来还是被删除了。

一、百余外部红队成员测试,秋季或开放至全部订阅用户

基于GPT-4o的高级语音模式目前仅向小部分ChatGPT Plus用户推出,可提供更自然的实时对话,允许用户随时打断,并能感知和响应用户情绪。

参与此Alpha测试的用户将收到一封包含说明的电子邮件,并在其ChatGPT手机端App中收到通知。OpenAI称,后续将继续滚动添加更多用户,并计划在秋季让每一个Plus订阅用户上都能使用。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

▲邀请邮件和App主页面

ChatGPT的高级语音模式于今年5月发布,其基于OpenAI全新旗舰模型GPT-4o,可以进行语音聊天和实时视频交互,比如通过视频影像理解线性方程、通过人的表情和语调理解并判断出人的情绪等。

OpenAI称,自首次发布以来,团队一直致力于加强语音对话的安全性和质量,与45种语言的100多名外部红队成员一起测试了语音功能。

为了保护隐私,OpenAI在训练模型时只用四种预设的声音说话,并构建了相应的系统来屏蔽与不同的输出,还采取了防护措施来屏蔽对暴力或版权内容的请求。

OpenAI计划在8月初,分享一份关于GPT-4o的功能、局限性和安全评估的详细报告。

二、第一波试用者开始整活了:练法语、学猫叫、解说足球

第一波试用者已经迫不及待地用上高级语音模式,并分享了自己试用体验。

艺术家Manuel Sainsily打开摄像头,一边实时拍摄自己的刚养的小猫和为其布置的环境,一边询问ChatGPT关于喂养的意见。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

ChatGPT的回应基本没有任何延迟,先是用非常宠爱的语气称赞了猫咪的可爱,随后在询问了更多信息后安慰Sainsily,告诉他不用担心。Sainsily感慨道:“这感觉就像与一位知识渊博的朋友进行视频通话。”

网友Bergara在社交平台Reddit分享道,ChatGPT拒绝了他所有的唱歌请求,也不愿意改变声线。当他让ChatGPT以不同的方式和情绪背诵一首诗歌时成功了,但要求它笑着背诵这首诗时,它拒绝了。

例如,Bergara称自己正在练习法语,让ChatGPT充当语言教练,询问其关于发音的意见。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

针对Bergara的单词发音,ChatGPT详细地给出了关于重音、尾音等的建议,并做了示范。同时其在教学风格上非常“鼓励式教育”,毫不吝啬地夸奖Bergara的发音,情绪价值直接拉满。

Bergara又让ChaGPT分别用害羞、生气的语气讲关于啤酒的笑话。ChatGPT对害羞的理解是用气声发音,在表达生气时则提高了自己的分贝。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

当ChatGPT被要求用悲伤的语气朗诵诗歌时,它听起来快要碎了……

Bergara称,到目前为止的测试里,ChatGPT表现出的样子和OpenAI所展示的差不多,但拒绝率似乎有点高,他推测可能是出于安全原因。

例如,当Bergara要求ChatGPT用歌声讲一个关于机器人和爱的故事,它称自己可以讲故事,但只能用平常说话的语气。

在ChatGPT讲故事的过程中,Bergara多次打断并要求它“加入更多感情”。ChatGPT照做了,其语气变得更加缓慢和生动。

还有的网友已经开始用ChatGPT整活了。

Squad联合创始人、首席技术官Ethan Sutin让ChatGPT模仿了各种各样的猫叫。不得不说这猫叫有些“魔性”,但似乎还挺真实的,因为我家猫被吸引过来了……

ChatGPT似乎还具备音乐演奏的能力。Sutin让其演奏一个C小调和弦,有没有懂乐理的读者朋友来听一下是否准确?

网友Cristiano Giardina让ChatGPT扮演起了足球比赛评论员。他分享了试用高级语音模式的一些初步印象:速度非常快,总是会产生有趣的结果,在说其他语言时总是带有美国口音。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

网友Kesku让ChatGPT说一种不存在的语言,然后解释这种语言是如何运作的。ChatGPT创造了一种基于声音的语言Glimnar,听起来有点像吟唱。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

尽管现在用上ChatGPT高级语音模式的用户还是少数,但随着其推送范围的扩大,也许我们能看到更多有趣的玩法和体验。

结语:OpenAI提高对AI安全的重视

AI在语音、视频方面,正在因为其充当欺诈工具的能力受到审查。尽管OpenAI的语音模式目前不允许生成新的声线或语音克隆,但该模式仍然可能会给人带来混淆。

在春季更新后的几个月里,OpenAI发布了一系列关于安全性和AI模型对齐的新论文。在此之前,其超级对齐团队已经解散,一些前任和现任员工批评其将重点转移到发布新产品而不是安全性上。目前来看,高级语音模式的推出放缓似乎是在向用户、监管机构和立法者表明OpenAI对安全的重视。

ChatGPT高级语音模式的发布也使OpenAI进一步与Meta的Llama 3.1模型、Anthropic的Claude 3等竞争对手区分开,给专注于情感语音的AI初创公司带来压力

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-01 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微信更新后 不用解锁手机 也能接听语音了
...整合进 iOS 系统里。比如微信接入 CallKit 后,别人给你打语音电话,你可以像接系统电话一样,无需打开微信
2025-01-24 00:33:00
ChatGPT连夜登陆iOS 免费无广告、还支持语音
...验。一手体验:用户交互简洁、模拟真人对话,还能支持语音输入整体来说,移动端的ChatGPT主打简洁流畅的风格,全力提供一个友好顺畅的聊天体验。下载后,首先会出现一个简单的开屏
2023-05-19 21:10:00
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
...「Her」还是期货,但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级版Siri
2024-09-10 13:38:00
新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式
...称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式,甚至可能是直接正式发布
2024-09-20 13:31:00
微软moment5更新:语音访问新增功能
...供了诸多更改,但对于大部分人来说可能没有太大需求:语音访问新增功能!现在可以使用以下语言使用语音访问:法语(法国、加拿大)德语西班牙语(西班牙、墨西哥)当你第一次打开语音访问
2024-03-02 01:55:00
电视一不注意就更新,越更新越卡顿,这些问题该如何解决?
...使用过程中却并不友好。软件频繁更新,电视越来越卡,语音功能也难“听懂”用户指令……花费大几千甚至上万元购买的智能电视,为什么让人不省心?这些问题又该如何解决?电视一不注意就更
2024-09-14 02:47:00
微信接不到视频和语音的六大原因
微信接不到视频和语音是一个比较常见的问题,导致微信无法接收视频和语音通话的主要原因,包括网络问题、微信版本过旧、手机设置问题、设备问题、微信账号问题、软件冲突以及微信服务器故障。
2024-07-06 14:48:00
雪佛兰创酷rs新增四种语音模式、更新六大场景
...消息,雪佛兰创酷RS汽车日前迎来OTA远程升级,新增四种语音模式、更新六大场景,涵盖智能语音模式、应用商店App、系统设置等。据介绍,新增四种智能语音模式,分别为螺狮粉模式、
2023-11-13 14:00:00
微信引用回复功能更新:可以回语音表情包了
...的消息,微信引用回复功能更新,现在可以引用表情包和语音进行回复,同时回复内容也不受限于文字,可以回复语音和表情包了。需要注意的是,当使用安卓系统的手机,分别向iOS系统与安卓
2025-04-03 16:11:00
更多关于科技的资讯:
日前,太重智能高端装备产业园区的厂房内一片欢腾。由企业自主研发的智能轴承,成功应用于大型电铲并顺利完成厂内模拟测试,各项性能指标均优于设计标准
2026-01-22 07:03:00
最近有件事儿越来越常见:外国人不光来中国旅游,还专门“打飞的”来看病。不是出于好奇体验,而是真心觉得值!值在哪儿?三个字
2026-01-21 21:52:00
中新经纬1月21日电 广东省政府网站21日公布《广东省人工智能赋能交通运输高质量发展若干政策措施》(下称《政策措施》)
2026-01-21 20:20:00
织金平远公司完成 500kVⅡ 组母线母差保护装置校验及传动
多彩贵州网讯(通讯员 史凡莉)近日,织金平远公司厂区内,500kVⅡ组母线设备区域一派忙碌景象。电热检修部与发电运行部工作人员有条不紊地开展母差保护A屏
2026-01-21 17:15:00
九阳太空厨房已安全稳定运行超1500天
中国消费者报报道(记者桑雪骐)航天员们如何健康、舒适地展开太空生活和吃好一日三餐,是大家都很关心的话题。据了解,这背后其实有一个我国自主研制的太空厨房
2026-01-21 18:05:00
秦皇岛经开区第一小学开展人工智能科技实践活动
河北新闻网讯(李佳新)日前,秦皇岛经开区第一小学开展以“AI探索,智创未来”为主题的人工智能科技实践,通过沉浸式实训活动激发学生的科技探索热情
2026-01-21 18:11:00
马年将至(农历),在广州大夫山森林公园,一些徒步爱好者分享了一种创意玩法——“画马”,相关穿越路线攻略一时引发追捧。所谓“画马”
2026-01-21 18:36:00
三重蝶变,中天钢铁解锁“企业主理”新范式
大寒虽寒,热潮涌动。原点空间路演大厅内,由中天钢铁主理的第37场沙龙——“AI智能体创新大赛总结沙龙”以三重蝶变,为常州“智能体+场景应用”示范城市建设吹响了热力全开的奋进号角
2026-01-21 18:28:00
苏州市女企协秘书长、国浩律师(苏州)事务所合伙人葛霞青律师荣登《钱伯斯大中华区指南2026》推荐榜单
江南时报讯 1月15日,全球领先的法律研究和分析机构钱伯斯(Chambers & Partners)发布《钱伯斯大中华区指南2026》(Chambers Greater China Region Guide 2026)
2026-01-21 15:23:00
盐城盐都:“翼”技傍身 照亮前程
江南时报讯 启动无人机,校准飞行参数,规划测绘航线,精准捕捉地面数据……日前,2026年盐城市盐都区首期无人机测绘操控员技能培训在都U+乐业空间正式开班
2026-01-21 15:24:00
全国首款!仙库3D智能足脊扫描仪正式发布!
近日,深圳仙库智能有限公司(以下简称“仙库”)正式发布仙库3D智能足脊扫描仪XK-CH005,这是全国首款实现“足脊一体”同步评估的硬核科技产品
2026-01-21 16:24:00
国家级备案落地!疯狂体育Foretell革命性AI平台,开启体育智能决策新阶段
2026年1月20日,疯狂体育正式官宣推出旗下AI赛事预测工具Foretell。凭借已经完成的国家互联网信息办公室深度合成服务算法备案资质
2026-01-21 16:47:00
当我们在思考“哪些中国企业创新做得不错”时,CES 2026舞台上的联想集团给出了一个全面而深刻的答案。这不仅仅是一次产品发布会
2026-01-21 16:49:00
近日,剑桥大学教育学院院长Hilary正式受聘为中国素质教育品牌欣乾程的学术顾问。此次合作不仅是国际顶尖学术力量与中国创新型教育机构的一次重要握手
2026-01-21 14:24:00
跨越顶奢与潮饮的“美酒+美食”表达 五粮液全力构建中国白酒全球新叙事
鲁网1月21日讯当一位新加坡米其林星厨在构思新菜单时,正在将中国白酒作为风味拼图中一块充满惊喜的“香料”。在他手中,一杯五粮液可能被用来平衡炙烤龙虾的鲜甜
2026-01-21 12:03:00