• 我的订阅
  • 科技

财经观察:提升人机交互效率 多模态大模型易用性进一步推进

类别:科技 发布时间:2024-05-14 13:59:00 来源:人民资讯

本文转自:人民网

人民网北京5月14日电 (焦磊、实习生张泊洋)陪人聊天、帮助分析工作中的问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,聊天机器人“Samantha”用充满智慧和幽默的回答展示出高度的智能性和适应性。当下,这些来自过去的科幻想象正加速照入现实中。

北京时间5月14日凌晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行输出,其中“o”代表“omni全能”。

一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

OpenAI CEO山姆・奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-14 15:45:24

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...一图像生成模型 OmniGen。OmniGen 模型具有良好的简洁性和易用性,集成了多种基础图像生成任务,包括但不限于
2024-10-30 09:53:00
...出厂预置软件、开机即用等特性,进一步提升了可靠性与易用性。在算法使用方面,产品内置丰富的基础模型库,全量算法授权,用户可以依据实际需求自行灵活选用和组合,确保更游刃有余地面对
2024-11-15 10:14:00
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...长视频生成等,将得到大幅改善;最后,随着AIGC效果和易用性的提升,内容生成流程将极度简化、便捷。在演讲的最后,肖欣延也表示,AI目前面临的事实一致性、不可控等问题,将来整个
2023-05-26 15:52:00
GPT:低代码的终局性机遇
...潜能,以及受限于传统软件开发思维框架,进一步提高“易用性”逐渐遭遇了瓶颈。而这种易用性的困境可能会因为GPT的成熟迎来新的机遇,本文作者对GPT带来的低代码新机遇进行了分析,
2023-05-10 21:00:00
讯飞星火V3.5春季上新,有能力更有“温度”
...置了许多限制条件,这使得我们难以客观地判断大模型的易用性。应用的下载量是一个直观的指标,能够直接反映出用户对应用的喜好。根据七麦数据的最新统计,截至4月26日,讯飞星火APP
2024-04-30 17:00:00
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...比;支持云端模型更新和升级,实现大模型边缘应用的高易用性。 开普云大模型平台产品:驾驭智能,驱动未来 开普云未来科技研究院副院长倪金松介绍了两款大模型平台级产品,包括开悟
2024-04-11 10:30:00
...目标,蚂蚁一直在努力优化和提高AI的可靠性、经济性和易用性。可靠性是用AI监督AI,以解决控制和“对齐”比人类聪明得多的模型;经济性是把大模型做“小”,这决定了大模型应用能否
2024-05-29 07:07:00
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...I技术负责人Mira Murati在直播中表示:“这是我们第一次在易用性方面真正迈出的一大步。” 价格低于GPT-4 TurboOpenAI研究员Mark Chen表示
2024-05-14 14:39:00
...类型数据的智能解析,极大地提高了数据的标准化程度和易用性,为上层应用提供了坚实的数据基石。MaaS平台构建了一套完备的数据综合应用体系,集“数据采集、数据建设、数据管理”于一
2025-01-14 21:07:00
更多关于科技的资讯: