• 我的订阅
  • 科技

ChatGPT高级语音正式开放!新增记忆功能,支持50种语言

类别:科技 发布时间:2024-09-26 13:34:00 来源:智东西
ChatGPT高级语音正式开放!新增记忆功能,支持50种语言

智东西9月25日消息,OpenAI今日宣布本周内将向所有ChatGPT Plus和Team用户开放高级语音模式。

除了已经可用的4种风格的声线之外,ChatGPT的高级语音模式中还新增了5种不同风格的声线。它还会说包括普通话在内的50多种语言。此外,高级语音模式还新增了自定义指令功能和记忆功能。

高级语音模式将会在美国先开放使用。而在欧盟、英国、瑞士、冰岛、挪威和列支敦士登的用户还暂时不可用。

以上这些更新仅适用于GPT-4o模型,而不适用于最近发布的o1。

一、新增5种风格声线、2大功能,会说超过50种语言

根据OpenAI的说法,所有订阅了ChatGPT的Plus和Team计划的付费用户都将在本周内获得ChatGPT高级语音模式的使用权限。下周,OpenAI计划将ChatGPT高级语音模式扩展到Edu和Enterprise计划的订阅用户。

高级语音模式将会在美国先开放使用。而在欧盟、英国、瑞士、冰岛、挪威和列支敦士登的用户还暂时不可用。

除了已经可用的4种风格的声线(活跃真诚的Breeze、开放积极的Juniper、沉着直率的Cove和自信乐观的Ember)之外,ChatGPT的高级语音模式中还新增了5种不同风格的声线(随和且多才多艺的Arbor、开朗率真的Maple、聪慧随性的Sol、冷静坚定的Spruce和聪明好学的Vale)。

此外,OpenAI为ChatGPT的高级语音模式新增了自定义指令功能和记忆功能。这些功能的增加,使得语音模式的交互体验更加丰富和个性化。

新增的自定义指令功能允许用户根据自己的需求定制ChatGPT的回复方式,包括但不限于设定对话的正式程度、回复的长度、称呼方式,以及是否持有观点或保持中立。用户可以通过这个功能告诉ChatGPT更多关于自己的信息,比如职业背景、兴趣爱好等,以便ChatGPT能够提供更加个性化和贴合用户需求的回答。

而记忆功能则是指ChatGPT能够记住用户在不同对话中提供的信息,从而在后续的交流中提供更加相关和个性化的回答。例如,如果用户告诉ChatGPT他们有某些饮食限制,记忆功能将使得ChatGPT在未来涉及到菜谱建议之类的对话中考虑到这些限制,并提供相应的建议或信息。

而且,ChatGPT高级语音模式还会说包括普通话在内的50多种语言。OpenAI在社交平台X上发布的帖子中附带了一段视频。视频中,用户向语音助手提出指令:由于让奶奶久等了,我需要向奶奶致歉。语音助手先用英语提出建议,并在用户反馈“奶奶只会说普通话”后,又用中文普通话表达了一遍。

//oss.zhidx.com/uploads/2024/09/66f3c2295e695_66f3c229593da_66f3c2295939f_20240925_155459.mp4

二、延迟发布的背后原因:AI语音功能引争议,需进行充分测试确保安全性

OpenAI将语音功能添加到ChatGPT的尝试很早就引发了争议。

在5月份宣布GPT-4o和高级语音模式的时候,人们注意到其中一个声线Sky与女演员Scarlett Johanssen的声音极为相似。而且,OpenAI的首席执行官Sam Altman在社交媒体上发布过“her”一词,可能暗指了电影《Her》,而Johansson正是该电影中AI语音助手的配音演员。

这引发了人们对于AI开发商在创建语音助手时模仿知名人士声音的担忧。后来,OpenAI否认了Sky与Johansson的关联,并立即下架了Sky。

此次宣布高级语音模式将正式开放的同时,OpenAI还强调了用户只能选择OpenAI提供的9种声线。并且,他们在发布前已对其安全性进行了评估,以避免语音模式被用于欺诈等不当行为。

“我们与公司外部的红队测试人员一起测试了模型的语音功能。这些测试人员总共会说45种不同的语言,代表着29个不同的地理区域,”OpenAI在发布会上对记者说。

由于需要进行安全测试,ChatGPT高级语音模式的推出从最初计划的6月底推迟到了7月底或8月初,并且最初只向OpenAI选定的用户群体推出。

而现在,OpenAI将向所有付费用户正式开放ChatGPT高级语音模式的举措,说明它已经做好了充足的准备。这也符合OpenAI近来谨慎的作风。

结语:AI语音赛道正在越来越卷

自从苹果Siri和亚马逊Alexa之类的AI语音助手兴起以来,AI开发商们一直希望让用户与生成式AI的对话体验更加贴近人类交流。

比如,由前谷歌Deepmind成员Alan Cowen创办的初创公司Hume AI,于9月11日发布了其第二代情感智能AI。它能够通过分析用户的语音,如口音、语气、语调、拟声词、节奏和停顿等,来理解用户的情绪和心理状态,并做出实时响应。

法国AI公司Kyutai于7月6日发布了Moshi。它能够理解和表达情感,模拟70种不同的情绪和风格进行交流。

谷歌于8月14日正式发布了智能语音助手Gemini Live。

据路透社昨日报道,Meta也在开发模拟知名演员声音的语音助理,并计划在明天凌晨开始的Meta Connect 2024大会上宣布这一功能。

来源:VentureBeat

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-26 14:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

ChatGPT高级语音助手正式上线!OpenAI:50多种语言、9种声线可选
...面向其所有付费用户开放ChatGPT的类人高级人工智能(AI)语音助手功能——“高级语音模式”(Advanced Voice Mode
2024-09-25 09:56:00
《崩坏:星穹铁道》1.4版本内容介绍
...本段剧情的实时对话记录,有配音的剧情还可以重听对话语音。其他● 「通往群星的轨道」「瞬息欢愉」「与你同行的回忆」「战意奔涌」中新增成就。● 新增聊天与短信对话框,可通过活动「
2023-10-12 20:33:00
《崩坏星穹铁道》1.5版本更新内容
...角色的短信。●新增部分帕姆任务。●新增了角色的部分语音,包含特定角色编队、角色晋阶、角色满级、激活行迹、激活星魂、开启战利品时,可触发最新互动语音。●在【背包】中查看光锥时,
2023-11-15 14:34:00
2024款腾势d9新增多车畅联、聚合资讯播报等功能
...今日迎来升级(其他款型后续开启OTA),此次升级主要在语音交互、座舱体验进行升级,新增多车畅联、聚合资讯播报等功能。IT之家附此次更新亮点内容如下:新增多车畅联,用户可在车机
2024-06-26 02:37:00
终于来了!OpenAI开放GPT-4o高级语音,还用中文说「对不起」
这项高级语音功能,大家可是等了好久。谷歌又被 OpenAI 截胡了。前脚谷歌刚刚升级完两款模型 Gemini-1.5-Pro-002 和 Gemini-1
2024-09-26 13:35:00
Meta发布生成式AI语音模型Voicebox,精通六种语言,支持多种语音功能 | 最前线
作者 | 周愚 编辑 | 邓咏仪美国时间6月16日,Meta正式发布语音生成模型Voicebox。据官网介绍,通过非自回归“流匹配”(Flow Matching)技术
2023-06-19 17:10:00
讯飞推出开放式办公耳机iflybudsair
...时转成文字,而且支持包括腾讯会议、钉钉、飞书、微信语音等主流网络会议App的线上会议录音,并支持录音实时转文字,可以自己区分说话人。 此外,它还可以在听音频、看视频时实时录
2022-12-27 11:11:00
ChatGPT连夜登陆iOS 免费无广告、还支持语音
...验。一手体验:用户交互简洁、模拟真人对话,还能支持语音输入整体来说,移动端的ChatGPT主打简洁流畅的风格,全力提供一个友好顺畅的聊天体验。下载后,首先会出现一个简单的开屏
2023-05-19 21:10:00
小鹏g9全场景语音2.0全面升级,,新增极速充电状态的智能灯
...次整车OTA升级,XmartOS版本号4.1.0。此次升级开放了全场景语音2.0全面开放,包含全时对话、多人对话等功能。同时,在超充、驾控及智能座舱等方面,本次升级也带来了不
2022-12-28 14:49:00
更多关于科技的资讯: