• 我的订阅
  • 科技

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

类别:科技 发布时间:2024-08-01 09:32:00 来源:智东西

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

GPT-4o的高级语音功能,终于不再是“期货”了!

智东西7月31日消息,今天凌晨,OpenAI宣布开始向一小部分ChatGPT Plus用户推出高级语音模式,基于GPT-4o提供更自然的实时对话。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

▲OpenAI上线高级语音模式

该模式上线后,不少收到邀请的网友已经玩起来了,并分享了自己试用的视频和感受。例如这是一段由ChatGPT献上的快嘴Rap和Beatbox,听起来还挺有模有样的。

总的来看,ChatGPT的高级语音模式与当初官方的演示差别并不大,几乎没有时延,各种语气也十分生动。不过其似乎在安全方面做了很多防护措施,ChatGPT拒绝用户请求的几率变高了。

ChatGPT的语音对话功能于去年9月首次推出。今年5月,OpenAI推出基于旗舰模型GPT-4o的更高级语音对话版,并进行了公开演示。GPT-4o使用单个多模态模型,而不是之前的三个独立模型来实现语音功能,从而降低了与聊天机器人对话的延迟。(OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了)

当时,OpenAI宣称该功能将在几周内陆续向免费和付费用户推出。但发布没几天,OpenAI就因演示中的ChatGPT声音,与《复仇者联盟》系列电影中“黑寡妇”扮演者、被影迷称为“寡姐”的斯嘉丽·约翰逊(Scarlett Johansson)声线过于相似,而遭到斯嘉丽本人的控诉和网友的强烈反对。

高级语音模式的发布日期也因此被推迟。尽管OpenAI坚称ChatGPT并没有模仿斯嘉丽的声音,但该声线后来还是被删除了。

一、百余外部红队成员测试,秋季或开放至全部订阅用户

基于GPT-4o的高级语音模式目前仅向小部分ChatGPT Plus用户推出,可提供更自然的实时对话,允许用户随时打断,并能感知和响应用户情绪。

参与此Alpha测试的用户将收到一封包含说明的电子邮件,并在其ChatGPT手机端App中收到通知。OpenAI称,后续将继续滚动添加更多用户,并计划在秋季让每一个Plus订阅用户上都能使用。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

▲邀请邮件和App主页面

ChatGPT的高级语音模式于今年5月发布,其基于OpenAI全新旗舰模型GPT-4o,可以进行语音聊天和实时视频交互,比如通过视频影像理解线性方程、通过人的表情和语调理解并判断出人的情绪等。

OpenAI称,自首次发布以来,团队一直致力于加强语音对话的安全性和质量,与45种语言的100多名外部红队成员一起测试了语音功能。

为了保护隐私,OpenAI在训练模型时只用四种预设的声音说话,并构建了相应的系统来屏蔽与不同的输出,还采取了防护措施来屏蔽对暴力或版权内容的请求。

OpenAI计划在8月初,分享一份关于GPT-4o的功能、局限性和安全评估的详细报告。

二、第一波试用者开始整活了:练法语、学猫叫、解说足球

第一波试用者已经迫不及待地用上高级语音模式,并分享了自己试用体验。

艺术家Manuel Sainsily打开摄像头,一边实时拍摄自己的刚养的小猫和为其布置的环境,一边询问ChatGPT关于喂养的意见。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

ChatGPT的回应基本没有任何延迟,先是用非常宠爱的语气称赞了猫咪的可爱,随后在询问了更多信息后安慰Sainsily,告诉他不用担心。Sainsily感慨道:“这感觉就像与一位知识渊博的朋友进行视频通话。”

网友Bergara在社交平台Reddit分享道,ChatGPT拒绝了他所有的唱歌请求,也不愿意改变声线。当他让ChatGPT以不同的方式和情绪背诵一首诗歌时成功了,但要求它笑着背诵这首诗时,它拒绝了。

例如,Bergara称自己正在练习法语,让ChatGPT充当语言教练,询问其关于发音的意见。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

针对Bergara的单词发音,ChatGPT详细地给出了关于重音、尾音等的建议,并做了示范。同时其在教学风格上非常“鼓励式教育”,毫不吝啬地夸奖Bergara的发音,情绪价值直接拉满。

Bergara又让ChaGPT分别用害羞、生气的语气讲关于啤酒的笑话。ChatGPT对害羞的理解是用气声发音,在表达生气时则提高了自己的分贝。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

当ChatGPT被要求用悲伤的语气朗诵诗歌时,它听起来快要碎了……

Bergara称,到目前为止的测试里,ChatGPT表现出的样子和OpenAI所展示的差不多,但拒绝率似乎有点高,他推测可能是出于安全原因。

例如,当Bergara要求ChatGPT用歌声讲一个关于机器人和爱的故事,它称自己可以讲故事,但只能用平常说话的语气。

在ChatGPT讲故事的过程中,Bergara多次打断并要求它“加入更多感情”。ChatGPT照做了,其语气变得更加缓慢和生动。

还有的网友已经开始用ChatGPT整活了。

Squad联合创始人、首席技术官Ethan Sutin让ChatGPT模仿了各种各样的猫叫。不得不说这猫叫有些“魔性”,但似乎还挺真实的,因为我家猫被吸引过来了……

ChatGPT似乎还具备音乐演奏的能力。Sutin让其演奏一个C小调和弦,有没有懂乐理的读者朋友来听一下是否准确?

网友Cristiano Giardina让ChatGPT扮演起了足球比赛评论员。他分享了试用高级语音模式的一些初步印象:速度非常快,总是会产生有趣的结果,在说其他语言时总是带有美国口音。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

网友Kesku让ChatGPT说一种不存在的语言,然后解释这种语言是如何运作的。ChatGPT创造了一种基于声音的语言Glimnar,听起来有点像吟唱。

OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了

尽管现在用上ChatGPT高级语音模式的用户还是少数,但随着其推送范围的扩大,也许我们能看到更多有趣的玩法和体验。

结语:OpenAI提高对AI安全的重视

AI在语音、视频方面,正在因为其充当欺诈工具的能力受到审查。尽管OpenAI的语音模式目前不允许生成新的声线或语音克隆,但该模式仍然可能会给人带来混淆。

在春季更新后的几个月里,OpenAI发布了一系列关于安全性和AI模型对齐的新论文。在此之前,其超级对齐团队已经解散,一些前任和现任员工批评其将重点转移到发布新产品而不是安全性上。目前来看,高级语音模式的推出放缓似乎是在向用户、监管机构和立法者表明OpenAI对安全的重视。

ChatGPT高级语音模式的发布也使OpenAI进一步与Meta的Llama 3.1模型、Anthropic的Claude 3等竞争对手区分开,给专注于情感语音的AI初创公司带来压力

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-01 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微信更新后 不用解锁手机 也能接听语音了
...整合进 iOS 系统里。比如微信接入 CallKit 后,别人给你打语音电话,你可以像接系统电话一样,无需打开微信
2025-01-24 00:33:00
ChatGPT连夜登陆iOS 免费无广告、还支持语音
...验。一手体验:用户交互简洁、模拟真人对话,还能支持语音输入整体来说,移动端的ChatGPT主打简洁流畅的风格,全力提供一个友好顺畅的聊天体验。下载后,首先会出现一个简单的开屏
2023-05-19 21:10:00
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
...「Her」还是期货,但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级版Siri
2024-09-10 13:38:00
新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式
...称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式,甚至可能是直接正式发布
2024-09-20 13:31:00
微软moment5更新:语音访问新增功能
...供了诸多更改,但对于大部分人来说可能没有太大需求:语音访问新增功能!现在可以使用以下语言使用语音访问:法语(法国、加拿大)德语西班牙语(西班牙、墨西哥)当你第一次打开语音访问
2024-03-02 01:55:00
电视一不注意就更新,越更新越卡顿,这些问题该如何解决?
...使用过程中却并不友好。软件频繁更新,电视越来越卡,语音功能也难“听懂”用户指令……花费大几千甚至上万元购买的智能电视,为什么让人不省心?这些问题又该如何解决?电视一不注意就更
2024-09-14 02:47:00
微信接不到视频和语音的六大原因
微信接不到视频和语音是一个比较常见的问题,导致微信无法接收视频和语音通话的主要原因,包括网络问题、微信版本过旧、手机设置问题、设备问题、微信账号问题、软件冲突以及微信服务器故障。
2024-07-06 14:48:00
雪佛兰创酷rs新增四种语音模式、更新六大场景
...消息,雪佛兰创酷RS汽车日前迎来OTA远程升级,新增四种语音模式、更新六大场景,涵盖智能语音模式、应用商店App、系统设置等。据介绍,新增四种智能语音模式,分别为螺狮粉模式、
2023-11-13 14:00:00
微信引用回复功能更新:可以回语音表情包了
...的消息,微信引用回复功能更新,现在可以引用表情包和语音进行回复,同时回复内容也不受限于文字,可以回复语音和表情包了。需要注意的是,当使用安卓系统的手机,分别向iOS系统与安卓
2025-04-03 16:11:00
更多关于科技的资讯:
大皖新闻讯 2026年,中国智能驾驶的竞争,已从喧嚣的“开城”竞赛,来到底层技术的“暗战”。随着L3级试点政策的“破冰”与商业化前夜的临近
2026-04-15 20:21:00
牢记嘱托开新局 日新江淮往前赶|从“十一个月量产”到“全球交付20GWh”,看天合储能的“滁州速度”
大皖新闻讯 4月14日,随“牢记嘱托开新局,日新江淮往前赶”采访团,大皖新闻记者走进天合储能(滁州)有限公司的生产车间
2026-04-15 20:21:00
深圳香蜜丽格x乔雅登|“乔雅登骨相美学示范中心”正式成立
骨蕴其内,美显于形。2026年4月14日,深圳香蜜丽格医疗美容携手Allergan Aesthetics艾尔建美学,隆重举办“乔雅登骨相美学示范中心”启动仪式
2026-04-15 20:44:00
摩美得气血和胶囊闪耀2026乌镇健康大会:气血通透她力量信任破局
2026年4月12日至16日,备受瞩目的乌镇健康大会盛大举办。作为大健康产业核心平台,本届大会汇聚了全产业链精英,共探行业发展新趋势
2026-04-15 20:44:00
“随手一拍,涨粉飞快。”年轻人拍短视频、发Vlog已成日常,然而,这些“随手拍随手发”可能正在危害国家安全的边缘徘徊。提到国家安全
2026-04-15 22:43:00
近日,中国建设银行正式发布2025年度报告,同步披露了旗下控股子公司建信消费金融有限责任公司(下称“建信消费金融”)的年度经营情况
2026-04-15 17:41:00
孙德士到临沂联通智云数据中心开展调研工作
鲁网4月15日讯4月8日,临沂市副市长孙德士一行前往临沂联通智云数据中心调研指导,深入考察算力基础设施建设、云服务能力及数字赋能应用成果
2026-04-15 17:41:00
会分析、超能算,这个“医生助手”让诊疗过程智慧又高效
河北新闻网讯(田薇)清晨,河北工程大学附属医院诊疗一线高效运转:医生口述要点,规范电子病历一键生成;影像科医生轻点鼠标
2026-04-15 17:51:00
保定市职业技术教育中心召开青年教师个人规划总结暨专业成长手册启用会
河北新闻网讯 为促进青年教师专业发展,搭建成长交流平台,近日,保定市职业技术教育中心召开“复盘·启程”青年教师个人规划总结暨专业成长手册启用会
2026-04-15 18:40:00
记者探馆|新品扎堆、全球汇聚,第六届消博会点燃消费新热潮
大皖新闻讯 4月13日至18日,第六届中国国际消费品博览会在海南海口举办。15日,大皖新闻记者深入展会现场,沉浸式感受这场消费盛会的火热氛围与独特魅力
2026-04-15 19:47:00
牢记嘱托开新局 日新江淮往前赶|从“幼苗”到“森林”,这家生物科技“小巨人”跑出加速度
大皖新闻讯 4 月的江淮大地,春意盎然。4月14日,大皖新闻记者随“牢记嘱托开新局 日新江淮往前赶”采访团来到在滁州经济技术开发区这片热土上
2026-04-15 19:48:00
中新经纬4月15日电 4月15日,2026酒仙桥论坛在北京国家会议中心、北京数字经济算力中心同步启幕。会上,产业链企业
2026-04-15 17:37:00
兆观医疗级智能指环亮相 CMEF 重新定义健康穿戴标准
在可穿戴设备经历了十余年的喧嚣后,行业似乎陷入了一个尴尬的瓶颈。消费级手环数据往往缺乏临床价值,而医疗级设备又难以走出医院冰冷的围墙
2026-04-15 14:06:00
运营筑基・资产长青丨拆解「济南领秀城贵和购物中心」消费REITs的长期主义逻辑
鲁网4月15日讯济南领秀城贵和购物中心以商业运营与资产经营双轮驱动,构筑项目长期可持续的突破性价值沉淀!2025年以来
2026-04-15 15:51:00
107家企业入库 保定市首批“数智场景合伙人”发布
4月10日,市数据局发布保定市首批“数智场景合伙人”入选企业名单,全市共107家企业纳入培育库,同时,优先选取好多素教(浙江)网络科技有限公司等13家数智场景企业与河北携飞数据技术有限公司等21家协同发展企业
2026-04-15 16:32:00