• 我的订阅
  • 科技

OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话

类别:科技 发布时间:2024-12-13 09:20:00 来源:华尔街见闻官方

来源:硬AI

OpenAI为期12个工作日的新产品和技术发布活动出了新王炸:在首次公开演示将近七个月后,OpenAI正式面向广大付费用户推出ChatGPT类人高级人工智能(AI)语音助手的新功能,实时视频对话。

美东时间12月12日周四,OpenAI宣布,在ChatGPT的移动端应用程序App中,上线ChatGPT高级语音模式Advanced Voice的视频和共享屏幕功能。Advanced Voice由OpenAI的多模态模型GPT-4o支持。

OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话

OpenAI的研究员在直播中演示了任何运用新功能,点击ChatGPT 聊天栏旁边的语音图标,然后点击左下角的视频图标,就可以启动视频对话。如果想共享屏幕,手机用户要点击打开一个有三个喧嚣的菜单,选择其中的“共享屏幕”(Share Screen)。

在和ChatGPT的视频对话中,OpenAI研究员提问,研究员先让GPT看到并和现场的OpenAI工作人员分别打过招呼,然后问GPT,现场谁的打扮最像圣诞老人,谁像圣诞老人的驯鹿,GPT均作出准确而回答。研究员演示了,给GPT转发一个短信内容及图片,让GPT建议如何回复对方的短信。

研究员还演示了,利用Advanced Voice的新功能让GPT帮忙校对或者通过GPT学习新东西。比如找出一些制作手冲咖啡的咖啡壶、过滤杯等工具,向GPT展示并询问如何使用这些工具,在操作时,让GPT评价做得如何,并给出建议。

OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话

OpenAI表示,大多数ChatGPT Plus和 Pro套餐的订阅用户以及所有Team用户都将可以在今后几天内通过ChatGPT的App访问周四推出的新功能,预计欧盟、瑞士、冰岛、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用户也将很快可以运用新功能。ChatGPT的企业版和教育版Enterprise和Edu将于明年1月上线新功能。

同时OpenAI宣布,在Advanced Voice这一高级语音模式中,新增了“限时”的圣诞老人声音作为“节日特供”,有效期持续到明年1月初,在全球范围内,所有移动、网络和桌面App用户都可选用,它可通过 ChatGPT 中的雪花图标访问。

OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话

华尔街见闻曾提到,今年5月OpenAI就在推出新旗舰模型GPT-4o时演示了语音模式Voice Mode,不过该模式真正落地一波三折。

OpenAI原计划6月末向一小批Plus计划用户推出该语音模式,6月又宣布推迟一个月发布,以便确保该功能安全有效地处理来自数百万用户的请求。当时OpenAI称,计划今年秋季让所有Plus用户都可以访问该功能,确切的时间表取决于是否达到内部对安全性和可靠性的高标准。

7月末,OpenAI对有限的部分付费Plus用户推出高级语音模式下的ChatGPT,称语音模式无法模仿他人的说话方式,且增加了新的过滤器,保证软件能够发现并拒绝某些生成音乐或其他形式受版权保护音频的请求。当时上线的语音模式缺少5月OpenAI展示过的不少功能,比如计算机视觉功能,类似于本周四OpenAI宣布将要推出的视频对话答问。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-13 12:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

大模型重塑智能硬件!人手一个智能助手的时代来了?
...开始出现全新的人机交互体验。AI智能助手更有针对性地实时解答你的“十万个为什么”;AI卡片录音机能帮你实时转写会议内容,还随手就罗列好了会议总结、要点分析和待办事项;AR眼镜
2024-11-04 09:52:00
语音呼叫 - 从电话沟通到智能语音助手的变革
...是通过传统电话实现的。人们可以通过拨号并与对方进行实时语音交流。然而,随着技术的发展,移动电话和互联网的普及,语音呼叫的方式也发生了极大的变化。2.从电话到智能语音助手现代语
2024-06-07 22:57:00
AI语音系统:颠覆未来的创新科技
...捷。它能够识别和翻译不同语言之间的对话,为人们提供实时翻译的服务。这在国际交流和旅行中发挥着重要作用。4.教育和培训AI语音系统在教育和培训领域也有着广泛的应用。它可以提供个
2024-06-08 22:38:00
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
...时打断的对话式交流,还有对设备屏幕的感知能力,可以实时解释用户的屏幕或视频信息。Gemini Live目前已经针对安卓设备推出
2024-09-10 13:38:00
ChatGPT语音助手功能推迟发布!OpenAI拟秋季向付费用户全面推出
...为GPT-4o推出了语音选项,GPT-4o是GPT-4模型的更新版本,在实时处理文本、音频和图像方面做得更好。OpenAI在一份声明中表示
2024-06-26 15:22:00
扣子OpenAPI突进智能语音战场!点满低延时、定制化、随时打断
...N#rd更重要的是,通过智能语音对话 OpenAPI。你还能将智能实时对话能力引入你自己的应用!不管是微信小程序还是自己的应用或游戏
2024-11-22 09:49:00
​OpenAI推出“全能模型”GPT-4o,支持语音、视频、文字实时交互
...绍了新模型的一些应用场景。最令人印象深刻的是它应对实时对话的能力。你可以在模型的回应过程中打断它,它会停下来,听你讲完并调整回应,就像真人一样。OpenAI 也展示了改变模型
2024-05-15 13:45:00
ChatGPT高级语音正式开放!新增记忆功能,支持50种语言
...、节奏和停顿等,来理解用户的情绪和心理状态,并做出实时响应。法国AI公司Kyutai于7月6日发布了Moshi。它能够理解和表达情感
2024-09-26 13:34:00
江苏移动举办新品发布会 推出多款“AI+”终端产品
...为核心,重塑工作生活交互方式。音频版集成语音导航与实时翻译等功能,通过语音指令即可管理日程、接听电话、播放音乐,打造移动生活中枢;显示版增加了翻译显示与会议提词等功能,跨国会
2025-08-27 17:24:00
更多关于科技的资讯:
WowNow即将亮相CES 2026|以AI驱动的柔性制造,探索消费端创意直连制造的新路径
中国创新科技品牌WowNow宣布,将于2026年1月6日至9日亮相在美国拉斯维加斯举办的国际消费电子展(CES 2026)
2026-01-05 11:04:00
国内多筒血拼正酣!海尔三筒洗衣机泰国亮相填补空白
国内三筒洗衣机市场正上演激烈角逐,消费者对分区洗护的需求推动产品快速普及,各大品牌纷纷加码布局,行业竞争持续升级。海尔三筒洗衣机在热销超30万台
2026-01-05 09:52:00
山东移动泰安分公司圆满完成“你好2026”泰山跨年音乐嘉年华通信保障
鲁网1月4日讯2025年12月31日晚,“你好2026”泰山跨年音乐嘉年华在泰安市泰汶吾悦广场西南侧盛大举行,吸引超过两万名乐迷齐聚一堂
2026-01-05 09:55:00
国产新原料赋能产品创新:一支用“牙齿”成分做成的牙膏
近年来,国产科研力量正在持续推动口腔健康科技进步。从材料源头研发到临床研究验证,一系列应用转化研究不仅展示了国产功效型材料的技术潜力
2026-01-05 10:03:00
“手机随时待命、消息秒回”——新兴职业“秒回师”以其即时响应与情感陪伴的特点,吸引了不少年轻人加入。与此同时,代遛宠物专员
2026-01-05 08:36:00
■王哲娟摘要:在数字化与知识经济时代,企业的竞争边界不断扩展,组织间的关系由单向依附转向多层协同。协同创新成为企业嵌入生态系统
2026-01-05 05:42:00
东南网龙岩1月4日讯(通讯员 詹春艳 林培民)近日,龙岩市新罗区10千伏中新线上空,一场静默而精准的“人机协同”带电作业悄然完成
2026-01-04 23:27:00
蔡高民:颠覆认知!打破西方理论垄断!中国老年学自主知识体系诞生
《全生命周期养能力发展与医养结合:理论和实践》的核心突破,在于建构“养”的元概念、定义与内涵外延,并以此为基础构建了逻辑自洽的三大理论体系
2026-01-04 20:15:00
编者按:周期更迭,变量叠加。站在“十五五”开局之年的关键节点上,各行业如何调整节奏、校准路径、寻找增量?中新经纬广邀多领域学者
2026-01-04 20:21:00
春节临近,年味渐浓。在贵阳,一场不同于传统年货市集的新春活动正在酝酿——它以“创意游乐场”为定位,融合在地风物、潮流文化与青年创造力
2026-01-04 21:50:00
不经意晃动手机,软件立即跳转购物页面。最近,记者实测发现,备受诟病的“摇一摇跳转”广告乱象依然时有发生,困扰着不少用户
2026-01-04 17:59:00
2025年度帆书APP经典热搜榜,精准解锁经典中的成长指南
当“信息过载”成为常态,“选择困难”深入骨髓,我们比任何时候都更需要一个清晰的信号:什么才是值得投入时间的真知?近日,帆书APP根据全年用户收听数据发布的“经典热搜榜”
2026-01-04 14:25:00
黄鹤权据光明网报道,英国《剑桥词典》将2025年年度词汇定为“准社交”,形容个体单方面与名人、虚拟角色或聊天机器人产生的密切连接感
2026-01-04 14:25:00
飞晟科技入选海南省儋州市中小企业数字化转型城市试点服务商
近日,海南省儋州市科学技术和工业信息化局对外公示《儋州市中小企业数字化转型城市试点服务商拟纳入名单(第一批)》。公示名单显示
2026-01-04 15:28:00
抖音生活服务联合南京德基广场落地“心动街区”,电视台直播+明星见面会+打卡活动助力商圈消费
12月30日,抖音生活服务“心动街区”活动联合江苏电视台城市频道零距离栏目发起“心动德基24h·南京跨年在德基”美食专场直播
2026-01-04 15:30:00