• 我的订阅
  • 头条热搜
openai发布gpt-4o多模态大模型
...5月14日凌晨1点,OpenAI举行春季发布会,发布最新GPT-4o多模态大模型,GPT-4o能读取人类情绪,另外,相较于GPT-4Trubo速度更快、价格也更便宜。OpenAI称,GPT-4o可以检测人的情绪。在演示中,Zoph将手机举到自己面前正对着脸,要求Cha...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
... CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
“试用完谷歌的新AI模型,再也不爱GPT”
...越 GPT-4 , Gemini 最特殊的一点是,它是谷歌带来的首个多模态大模型,也就是能不光能打字互动,也能进行语音、视频、图片的互动。按照谷歌的说法,现有的所谓多模态大模型,都是单独训练了文本、视觉和音频等模型,再把...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
...清华大学智能产业研究院首席研究员聂再清看来,这类多模态语音助手,在易用性方面迈出了一大步,让人窥见了未来通用语音助手的样貌。通用语音助手就是人类在数字世界里的代理或管家,可以帮人解决一切数字事务。未来...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...ified Autonomous Driving)的道路测试表现,同时还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示,全景展示通用人工智能(AGI)技术驱动的灵活自适应、深度个性化、安全可信赖、有人文关怀的未...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
...型)。Sam Altman在社交媒体X上发布推文称,GPT-4o是原生多模态模型,能够跨越语音、文本和视觉进行推理和交流。在官方演示中,ChatGPT可以直接通过摄像头,判断演示者的心情、正在做的事;可以感受演示者过于急促的呼吸,并...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...元宇宙情绪感知、基于听觉的情绪感知以及最终产生的多模态情绪判断。团队选择了比动漫人物、动物在表情复现上更为精细的数字人写实形象作为建模方案,而实现表情驱动则需要对真人的眉毛、眼睛、鼻子、嘴巴等70个特征...……更多
Gemini 超越 GPT-4 靠作弊?谷歌承认:是的,演示视频经过了剪辑
...竟发生了 180° 转变。昨天,谷歌在 X 上展示 Gemini 原生多模态能力的 6 分半钟视频下,几乎是清一色的赞扬:而到了今天,Gemini 还是那个 Gemini,但网友已经不买账了:发生了什么,才会让人们的态度一夜转变?原因在于那个 6 ...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加深,Amazon ...……更多
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...年4月的AgentBench开始,智谱针对AutoGLM和GLM-PC的模型——多模态模型CogAgent的研发工作进行了一年半的时间。GLM-PC技术负责人潘立航现场分享说,CogAgent2.0具有更强的GUI(图形用户界面)视觉感知能力,能够进行高清晰度文本和UI界...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本,聚焦多模态和端侧应用。此前OpenAI公司CEO奥尔特曼(Sam Altman)就已经否认了公司将会发布GPT-5,他表示新版GPT非常“神奇”。根据OpenAI官方网站介绍,GPT-4o中的“o”代表Omni,也...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...字小说的内容生成能力;•多,图生小说、文生插图等多模态交互能力;•长,一次读懂长达100万字小说的内容理解力。大:全球首个万字创作大模型,一键生成万字小说唐太宗办亚运会,孙悟空遇到钢铁侠,皮卡丘闯入天空之...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
GPT-4o颠覆传统教育,鸡娃的路已经被AI堵\\\
.....01GPT-4o和AI全家桶OpenAI在5月14日推行一款真正意义上的全模态AI,ChatGPT-4o模型,“o”代表“omni”,意为“全能”。这说明了ChatGPT-4o已经不仅是一个升级版的聊天AI,还是一个全能型的智能助手,可以实现多模态交互。它不仅可...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
更多关于科技的资讯:
老外看完《哪吒2》称中国动画杀疯!漫威喊大家看《美国队长4》新预告放出
快科技2月11日消息,近日,一老外看完《哪吒2》称中国动画杀疯了,影院基本座无虚席,IMAX厅第一二排都坐满了,放映结束后全场鼓掌
2025-02-11 13:48:00
Arm CEO:DeepSeek低成本是谣言 会被封杀
快科技2月11日消息,据媒体报道,近日,全球最大的半导体IP厂商Arm公司CEO Rene Haas在接受采访时坦言,中国AI新创公司DeepSeek横空出世确实令人意外
2025-02-11 13:48:00
实干争春看贵州|印江橡胶垫热销海外
2月11日8时30分,贵州印江经开区富鼎橡塑有限公司车间内,轰鸣的机器声奏响了新春序曲。只见原材料、半成品、成品等各类橡胶制品堆积如山
2025-02-11 14:03:00
《黑神话:悟空》×名创优品联合主题店开业月余,多款衍生品售罄
文|罗曾在情绪价值驱动消费的时代背景下,IP已成为激发消费者热情、触达其内心的关键要素。2024年问世的《黑神话:悟空》迅速风靡全球
2025-02-11 14:15:00
曾经的合资SUV王者!全新现代胜达推出一口价:17.58万元起
快科技2月11日消息,北京现代宣布第五代胜达推出“焕新一口价”政策,起售价调整至17.58万元,较原指导价区间19.58万-26
2025-02-11 14:18:00
勤哲Excel服务器自动生成跨领域经营企业中的管理系统
在当今竞争激烈的商业环境中,企业运营效率的高低往往决定了其在市场中的地位和生存能力。而信息化系统的应用,正逐渐成为企业提升运营效率的关键因素
2025-02-11 14:45:00
姐妹俩开着云南制造的飞机回家过年:油费六七百、根本不怕堵
快科技2月11日消息,回家过年,想必很多自驾的朋友都经历过拥堵,有些甚至堵到怀疑人生,每当这时候,总会有人感慨要是自己的车会飞就好了
2025-02-11 14:48:00
中国科学家发明柔性太阳能电池:与人体皮肤完美共形
快科技2月11日消息,华中科技大学团队成功研制出兼具卓越机械柔韧性与高效光电转换的可拉伸太阳能电池,为可穿戴设备供能提供了创新方案
2025-02-11 14:48:00
尚界来了!华为、上汽合作敲定:鸿蒙智行将推第五品牌 上汽集团大涨超7%
快科技2月11日消息,四界之后,华为“第五界”马上也要来了。据国内媒体报道,行业人士透露,华为与上汽的合作模式已确定将使用智选车模式
2025-02-11 14:48:00
《王者荣耀》免费送皮肤了:联动洛阳 明世隐变诗人
快科技2月11日消息,《王者荣耀》宣布,将推出明世隐“景韶洛都”新皮肤,免费送。这是王者荣耀x神都洛阳文创联动皮肤,以古代文人雅士和牡丹为主题灵感
2025-02-11 14:48:00
扩展品牌布局!赛力斯申请问界二手车、问界金融、问界保险等商标
快科技2月11日消息,赛力斯汽车有限公司近期申请注册了包括“问界二手车”、“问界金融”、“问界售后”、“问界保险”、“问界租赁”
2025-02-11 14:48:00
鸿蒙影像之王!曝华为Pura 80 Ultra首发国产1英寸主摄:采用RYYB阵列
快科技2月11日消息,博主数码闲聊站暗示,华为Pura 80 Ultra工程机配备国产自研1英寸超大底主摄,同时配备1/1
2025-02-11 14:48:00
近期,DeepSeek引发热烈关注。邮储银行积极拥抱AI技术变革,依托自有大模型“邮智”,第一时间本地部署并集成DeepSeek-V3模型和轻量DeepSeek-R1推理模型
2025-02-11 14:54:00
快准车服作战2025!绽放2025!
“共识聚心,作战扬旌”,2025年1月17日,快准车服2025战略共识大会暨作战中心誓师大会在浙大校友园盛大举行并圆满落幕
2025-02-11 15:00:00
冰雪盛会开赛!京东运动带来冠军同款滑雪装备,每满200减30
这个冬天,哈尔滨再度成为全国瞩目的顶流,银装素裹的冰雕奇景与热血沸腾的冰雪运动交织,掀起了全民参与的热情。京东数据显示
2025-02-11 15:03:00