• 我的订阅
  • 科技

电影里的人工智能照进现实?GPT-4o挑战苹果Siri

类别:科技 发布时间:2024-05-14 16:52:00 来源:南方都市报

南都记者了解获悉,GPT-4o的升级迭代主要在于四方面:一是融媒能力更强,GPT-4o已同时具备文本、图片、视频、音频多方面的能力,即可以接受任何文本、音频等形式及其组合的输入,并生成同样媒介形式的回答;二是速度更快、反应时间接近人类;三是GPT-4o将面向ChatGPT的所有付费和免费用户发布;四是ChatGPT在不用注册即可使用的基础上,还增加了桌面程序,交互更便利。

在融媒能力方面,发布会上,研究主管Mike Chen和Beridzov轮番演示。当Mike Chen向GPT-4o表示自己在发布会上比较紧张时,GPT-4o快速安慰“别紧张,深呼吸,记住你可是专家”。当Mike Chen顽皮地假装遵从GPT-4o的建议,“激烈”地呼吸时,GPT-4o发出了笑声并调侃“你不是吸尘器”,并一对一实时指导Mike Chen呼吸要诀,当“察觉”到Mike Chen呼吸正常时,GPT-4o赞许地表示“就是这样”。

据Mike Chen总结介绍,用户使用GPT-4o可以感受到以下几方面的升级:一是用户可以随时打断模型,不用等到模型完成一个回合即可插话,二是模型升级后能实时响应、没有时延,三是模型学会了情感解读。后续根据研究主管Beridzov的演示,当Beridzov将手机镜头拍摄自己在一张纸上演示线性方程式时,GPT-4o能实时给予指导和解法。

发布会上, OpenAI 的首席技术官 Mira Murati还介绍,GPT-4o的文本、推理和编码智能方面性能达到了GPT-4 Turbo水平,但速度比GPT-4 Turbo快2倍,速率限制提高5倍,最高可达每分钟1000万token,而价格则便宜了一半。

电影里的人工智能照进现实?GPT-4o挑战苹果Siri

同时,GPT-4o的文本和图像功能将在ChatGPT更新后提供给所有用户,Plus用户的消息数量使用上限是免费版的5倍,普通用户达到使用上限后会切换回GPT-3.5版本。而新版语音模式将在未来几周向Plus用户推出,同时也将会在API(应用接口)中向小范围推出对GPT-4o的新音频和视频功能的支持。

英伟达科学家 Jim Fan发表评论称,从技术角度来看,OpenAI 已经找到了一种方法,可以将音频直接映射到音频作为一级模态,并将视频实时传输。这些需要对 token 化和架构进行一些新的研究,但总体来说是一个数据和系统优化问题(大多数事情都是如此)。

电影里的人工智能照进现实?GPT-4o挑战苹果Siri

他还表示,GPT-4o更接近GPT-5了,在Google明天将举行的I/O 大会之前发布,OpenAI赢得了更多时间、非常明智。而GPT-4o也更加活泼,更像电影中的《她》了,更像是向一个更具情感和个性的 AI 转变,此前OpenAI 似乎一直在积极抑制这种变化。

据悉,OpenAI本次现场演示选择的声音是“Sky”,该声音听起来酷似科幻爱情片《她(Her)》中的“萨曼莎”。该电影讲述了作家西奥多在结束了一段令他心碎的爱情长跑之后,爱上了电脑操作系统里的女声“萨曼莎”,“萨曼莎”嗓音性感、风趣幽默、善解人意,让孤独的男主泥足深陷。而“萨曼莎”的配音演员正是斯嘉丽·约翰逊。

发布会当天,奥特曼自己也在X上发了这部电影的名字《她(Her)》,还有人干脆把电影海报里的脸换成了奥特曼的。

电影里的人工智能照进现实?GPT-4o挑战苹果Siri

不少网友看完发布会的第一感觉是,升级后GPT-4o似乎正在挑战苹果Siri。不过前不久,有媒体报道称,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。

Jim Fan强调,“谁先赢得苹果谁将大获全胜”。在Jim Fan看来,GPT-4o与苹果iOS可以在三个层次上整合。“一是抛弃 Siri。OpenAI 为 iOS 提炼出一个更小层级、纯粹设备上的 GPT-4o,可选择付费升级以使用云端;二是将摄像头或屏幕传输到模型的原生功能里,芯片级支持神经音频/视频编解码器;三是与 iOS 系统级操作API和智能家居 API 集成。这可能会成为从一开始就拥有10亿用户的 AI 代理产品。”

在发布会之外,OpenAI CEO萨姆·奥特曼发布博文表示,GPT-4o新的语音(和视频)模式是自己用过的最好的计算机界面。“感觉就像电影里的人工智能一样;我仍然有点惊讶它是真的。事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。”

奥特曼还提到,OpenAI的重要使命之一就是免费(或以优惠价格)向人们提供功能强大的人工智能工具,“我感到非常自豪的是,我们在ChatGPT中免费提供了世界上最好的模型,并且没有广告或类似的东西。我们是一家企业,会找到很多可以收费的东西,这将帮助我们为数十亿人提供免费、出色的人工智能服务(希望如此)。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-14 17:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

科幻电影人“AIGC焦虑”的终点在哪里?
...。”“要走在终端变革前才能拿到生存的可能性”“当下人工智能的进化速度太快了。在分裂式变化面前,几何级数的新知识、新变革扑面而来,你会觉得有点压抑感。”聊起AIGC,导演郭帆坦
2023-06-13 14:28:00
AI无人机“杀死了”操作员,“审判日”要来了?
...…多家媒体报道称,在美国空军的一次模拟测试中,一架人工智能(AI)无人机为了达成任务,竟自行决定要“终结”妨碍它进行攻击的人类操作员。据美国“商业内幕”网报道,美国空军“人工
2023-06-07 18:17:00
谷歌CEO皮查伊评苹果Vision Pro头显:令人感到兴奋 但还没亲自体验过
...近接受彭博社采访时发表了上述评论,他在采访中谈到了人工智能、硅谷近期的低迷等多个话题。当被问及谷歌是否会进一步裁员时,皮查伊表示,公司将继续努力提高自身效率。今年 1 月,谷
2023-06-13 15:04:00
苹果被大模型打得措手不及
...泰坦”造车项目也被取消,大部分汽车团队成员将被转至人工智能部门,取消造车的原因我们在文章《苹果也无法在造车上找到差异化》做出了分析,这里不多赘述。外界普遍认为,苹果若想继续保
2024-03-26 10:25:00
昨夜今晨:第二批千兆城市公布 微信正式内测外卖业务 阿里巴巴全球数学竞赛征题
...双千兆网络深度覆盖,统筹布局双千兆网络、数据中心、人工智能等基础设施建设,推动互联互通、共建共享、协调联动,加快打造云网融合、双网一体的网络架构和算力供给体系;要促进行业融合
2023-02-16 11:00:00
人工智能赋能电影创作,ChatGPT是否会让更多人类失业?
...十分钟后ChatGPT给他发来结果,眼神、语速均可以调整,人工智能学习的速度是指数级的。郭帆感慨:这根本不是工具,“它就是一个导演,如果这个指令是老板下发的呢,那导演不就不需
2023-06-15 22:51:00
用AI当导演,一个人就能拍电影?
2022年11月,OpenAI研发了人工智能技术驱动的自然语言处理工具 ChatGPT,开启了一种全新的检索信息和交流方式
2023-11-07 14:46:00
科技浪潮下,电影产业走上破立之路
...能获得先机。虚拟拍摄:潜力待开发当下,数字化技术如人工智能、虚拟现实(VR)、增强现实(AR)等,被广泛应用于电影的创作中。尤其是在拍摄环节,这些技术能够实现更高效的场景构建
2024-05-15 10:01:00
“苹果GPT”秘密开发中?
...记者马克·古尔曼(Mark Gurman)爆料,苹果正在悄悄研发人工智能工具。苹果有多个团队参与该项目,包括展开解决潜在隐私问题的工作。据知情人士透露,苹果已经建立了自己的大
2023-07-20 16:00:00
更多关于科技的资讯: