• 我的订阅
  • 科技

OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话

类别:科技 发布时间:2024-12-13 09:20:00 来源:华尔街见闻官方

来源:硬AI

OpenAI为期12个工作日的新产品和技术发布活动出了新王炸:在首次公开演示将近七个月后,OpenAI正式面向广大付费用户推出ChatGPT类人高级人工智能(AI)语音助手的新功能,实时视频对话。

美东时间12月12日周四,OpenAI宣布,在ChatGPT的移动端应用程序App中,上线ChatGPT高级语音模式Advanced Voice的视频和共享屏幕功能。Advanced Voice由OpenAI的多模态模型GPT-4o支持。

OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话

OpenAI的研究员在直播中演示了任何运用新功能,点击ChatGPT 聊天栏旁边的语音图标,然后点击左下角的视频图标,就可以启动视频对话。如果想共享屏幕,手机用户要点击打开一个有三个喧嚣的菜单,选择其中的“共享屏幕”(Share Screen)。

在和ChatGPT的视频对话中,OpenAI研究员提问,研究员先让GPT看到并和现场的OpenAI工作人员分别打过招呼,然后问GPT,现场谁的打扮最像圣诞老人,谁像圣诞老人的驯鹿,GPT均作出准确而回答。研究员演示了,给GPT转发一个短信内容及图片,让GPT建议如何回复对方的短信。

研究员还演示了,利用Advanced Voice的新功能让GPT帮忙校对或者通过GPT学习新东西。比如找出一些制作手冲咖啡的咖啡壶、过滤杯等工具,向GPT展示并询问如何使用这些工具,在操作时,让GPT评价做得如何,并给出建议。

OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话

OpenAI表示,大多数ChatGPT Plus和 Pro套餐的订阅用户以及所有Team用户都将可以在今后几天内通过ChatGPT的App访问周四推出的新功能,预计欧盟、瑞士、冰岛、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用户也将很快可以运用新功能。ChatGPT的企业版和教育版Enterprise和Edu将于明年1月上线新功能。

同时OpenAI宣布,在Advanced Voice这一高级语音模式中,新增了“限时”的圣诞老人声音作为“节日特供”,有效期持续到明年1月初,在全球范围内,所有移动、网络和桌面App用户都可选用,它可通过 ChatGPT 中的雪花图标访问。

OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话

华尔街见闻曾提到,今年5月OpenAI就在推出新旗舰模型GPT-4o时演示了语音模式Voice Mode,不过该模式真正落地一波三折。

OpenAI原计划6月末向一小批Plus计划用户推出该语音模式,6月又宣布推迟一个月发布,以便确保该功能安全有效地处理来自数百万用户的请求。当时OpenAI称,计划今年秋季让所有Plus用户都可以访问该功能,确切的时间表取决于是否达到内部对安全性和可靠性的高标准。

7月末,OpenAI对有限的部分付费Plus用户推出高级语音模式下的ChatGPT,称语音模式无法模仿他人的说话方式,且增加了新的过滤器,保证软件能够发现并拒绝某些生成音乐或其他形式受版权保护音频的请求。当时上线的语音模式缺少5月OpenAI展示过的不少功能,比如计算机视觉功能,类似于本周四OpenAI宣布将要推出的视频对话答问。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-13 12:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

大模型重塑智能硬件!人手一个智能助手的时代来了?
...开始出现全新的人机交互体验。AI智能助手更有针对性地实时解答你的“十万个为什么”;AI卡片录音机能帮你实时转写会议内容,还随手就罗列好了会议总结、要点分析和待办事项;AR眼镜
2024-11-04 09:52:00
语音呼叫 - 从电话沟通到智能语音助手的变革
...是通过传统电话实现的。人们可以通过拨号并与对方进行实时语音交流。然而,随着技术的发展,移动电话和互联网的普及,语音呼叫的方式也发生了极大的变化。2.从电话到智能语音助手现代语
2024-06-07 22:57:00
AI语音系统:颠覆未来的创新科技
...捷。它能够识别和翻译不同语言之间的对话,为人们提供实时翻译的服务。这在国际交流和旅行中发挥着重要作用。4.教育和培训AI语音系统在教育和培训领域也有着广泛的应用。它可以提供个
2024-06-08 22:38:00
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
...时打断的对话式交流,还有对设备屏幕的感知能力,可以实时解释用户的屏幕或视频信息。Gemini Live目前已经针对安卓设备推出
2024-09-10 13:38:00
ChatGPT语音助手功能推迟发布!OpenAI拟秋季向付费用户全面推出
...为GPT-4o推出了语音选项,GPT-4o是GPT-4模型的更新版本,在实时处理文本、音频和图像方面做得更好。OpenAI在一份声明中表示
2024-06-26 15:22:00
扣子OpenAPI突进智能语音战场!点满低延时、定制化、随时打断
...N#rd更重要的是,通过智能语音对话 OpenAPI。你还能将智能实时对话能力引入你自己的应用!不管是微信小程序还是自己的应用或游戏
2024-11-22 09:49:00
​OpenAI推出“全能模型”GPT-4o,支持语音、视频、文字实时交互
...绍了新模型的一些应用场景。最令人印象深刻的是它应对实时对话的能力。你可以在模型的回应过程中打断它,它会停下来,听你讲完并调整回应,就像真人一样。OpenAI 也展示了改变模型
2024-05-15 13:45:00
ChatGPT高级语音正式开放!新增记忆功能,支持50种语言
...、节奏和停顿等,来理解用户的情绪和心理状态,并做出实时响应。法国AI公司Kyutai于7月6日发布了Moshi。它能够理解和表达情感
2024-09-26 13:34:00
OpenAI突然更新!GPT-4o推高级语音版,问题秒回答,网友玩疯了
...ChatGPT Plus用户推出高级语音模式,基于GPT-4o提供更自然的实时对话。 ▲OpenAI上线高级语音模式该模式上线后
2024-08-01 09:32:00
更多关于科技的资讯: