• 我的订阅
  • 头条热搜
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
生成式AI:手机厂商高端梦最后的希望
...搬上手机?Amon认为,目前大模型正朝着“轻量化”“多模态”方向发展,以云端作为AI大脑,边缘端和终端作为小脑,这样一种云+端的“混合AI”模式成为技术发展的主要趋势。如何将AI大模型搬到手机上,手机厂商应充分考虑...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
“360智脑大模型4.0”正式发布,图片、文字、视频互相生成,已接入360全家桶 | 最前线
...。而本次360发布的智脑大模型,是一个千亿级别的自研多模态大模型。据介绍,“智脑大模型”已经具备四大核心能力,包括文字处理能力、图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图...……更多
盘点Testin云测三大实操案例,AI测试为何成为头部企业首选?
...通过整合机器视觉与自然语言处理技术,该系统构建起多模态智能测试能力矩阵,为企业提供贯穿测试全链路的自动化、智能化 AI 测试解决方案。目前已成为金融、汽车、互联网等领域头部企业的战略选择,持续赋能行业数智化质...……更多
...者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
智象多模态生成大模型3.0版发布
...合肥举行。现场,智象未来科技有限公司正式发布智象多模态生成大模型3.0版。智象未来创始人兼CEO梅涛发布智象多模态生成大模型3.0版。主办方供图“智象多模态生成大模型3.0版全面升级图像和视频生成能力。”据智象未来创...……更多
盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证 【盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证】财联社12月13日电,盛视科技在互动平台表示,公司基于多...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
科大讯飞副总裁刘聪:认知智能大模型的技术阶跃及颠覆式影响|WISE2023颠覆AIGC产业发展峰会
...亚于PC或互联网诞生”;GPT-4发布后大家非常关注它的多模态能力,客观来讲其在很多语言能力上的提升更加值得重视;谷歌大脑与DeepMind合并,并且推出了PaLM2,效果也值得持续关注。认知大模型展现出的智能涌现推动了通用人...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
全球几十种大模型评测,如何甄别可信度?
...秤)大语言模型评测体系,该评测体系覆盖语言模型、多模态模型、语音语言模型等多种模态,并针对不同模态设计相应的评测指标和方法。12月19日,智源再次发布了迭代后新版本的FlagEval,目前FlagEval已覆盖全球800多个开闭源...……更多
不止卷硬件!理想新一代VLA智驾大模型有望下半年落地
...已启动端到端VLA模型的研究,将两个模型合二为一,使多模态大模型内化为端到端智驾大模型的一种能力。那么,VLA智驾大模型与此前的智驾系统有何区别呢?VLA智驾大模型结合了端到端和VLM(视觉语言)多模态模型的优势,能...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视...……更多
谷歌史上最强大模型!Gemini 2.0正式发布
...今为止功能最强的AI模型,带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升,速度甚至达到了后者的两倍。支持图...……更多
...行业难题。海尔消费金融(简称“海尔消金”)创新引入多模态大模型,并使用大小模型协同机制,充分发挥大小模型的专业能力,构建了一套完整的活体照欺诈防控体系,能够更加精准地识别和防范风险。技术瓶颈催生创新需求...……更多
中信证券:谷歌Gemini模型发布 AI进入多模态时代 【中信证券:谷歌Gemini模型发布 AI进入多模态时代】财联社12月7日电,中信证券研报指出,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemi...……更多
全球首个全模态大模型紫东太初2.0发布,中科院王金桥:希望实现更类人的智能
...能框架的最新进展。会上,基于昇思AI框架的全球首个全模态大模型“紫东.太初2.0”正式发布,支持多轮问答、文本创作、图像生成、3D理解、信号分析等跨模态任务。“我们的初心就是希望机器实现更类人的智能。”中科院自...……更多
...景分析……中科院自动化研究所16日发布“紫东太初”全模态大模型,并首次对外实时展示了该模型在音乐理解与生成、三维场景导航、信号理解、多模态对话等方面的全新功能。中科院自动化研究所所长徐波介绍,“紫东太初...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...家王晓刚17日宣布,商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧8B模型首包延迟在300毫秒以内,推理速度40Tokens/秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
体验报告来了!记者亲测百度“文心一言”
...语言模型较常见的优势和能力,还表现出了中文理解、多模态生成能力。《科创板日报》记者特地从这些方面进行了测试。首先是文学创作,记者让其仿造三体风格写一篇800字的科幻小说。文心一言的回答是:之后,记者让其编...……更多
从Agent到多模态,大模型想要什么?
图片来源@视觉中国文|李智勇OpenAI 9.25发了个关于多模态版本的Blog说chatGPT现在能够看、听、说了,体验过的同学反馈还不错,那这意味着什么?应用>纯粹的智能改进同纯粹的智能提升相比多模态是一种应用可能性的提升。...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
更多关于科技的资讯:
烟台银行数字化转型再提速 获评“数智化转型先锋企业”
大众网记者 李慧 通讯员 李东霞 烟台报道近日,由金科创新社主办的“2025金融科技创新发展论坛暨第八届金融科技管理人年会”在成都举行
2025-08-07 15:23:00
全球销量增20%,份额净增1.2pct!海尔空调郑州发布新成果
持续的高温炙烤与“以旧换新”政策叠加,让今年的空调市场格外火热。面对行业普遍面临的流量枯竭、行业内卷、高运营成本三大挑战
2025-08-07 15:36:00
强冷必然不舒适?海尔云溪“性能神机”两者兼得
长久以来,空调行业似乎藏着一个隐形难题:想拥抱快速制冷的强劲体验,就得忍受冷风直吹的不适;若追求柔和风感,又难免要和制冷效率妥协
2025-08-07 15:38:00
AI空调陷入红海!海尔空调率先主导AI空调标准领先一步
夏天离不开空调,但现在的“AI空调”是不是让你有点懵?语音喊半天它听不懂你的方言?功能按键一大堆,真正有用的没几个?宣传说得天花乱坠
2025-08-07 15:38:00
海尔空调主导制定行业首个AI空调标准
在人工智能技术重塑空调行业的浪潮中,市场涌现大量“AI概念”产品。然而,在快速发展过程中,部分产品未能真正聚焦用户对“智能便捷 + 健康舒适”的核心需求
2025-08-07 15:39:00
医渡科技多篇高质量科研论文见刊,“产品+服务”模式成效显著
近一年,国内AI医疗头部企业医渡科技(2158.HK)在“AI for Science”浪潮中持续发力,深度融合AI技术与疾病洞察力
2025-08-07 15:47:00
营养师团队深度护航,燕教授助力经销商突破事业瓶颈
在健康产业蓬勃发展的今天,经销商们既面临着广阔的市场机遇,也承受着日趋激烈的竞争压力。如何精准把握消费者需求、高效解决服务过程中的疑难问题
2025-08-07 15:47:00
新华网北京8月7日电(韩永先)6月25日,宁德时代(300750.SZ)以不正当竞争纠纷为由,对海辰储能等公司发起的专利技术型诉讼即将在8月12日开庭审理
2025-08-07 15:47:00
华鼎冷链赋能北京餐饮冷链 构建京津冀快速冷链配送网
在餐饮连锁化率突破20%的背景下,北京餐饮市场对冷链运输的需求呈现精细化、高效化特征。作为专注冷链物流基础设施建设的服务商
2025-08-07 15:47:00
企鹅获艾媒咨询“中国户外羽绒服开创者”等多项市场地位确认
近期,企鹅获全球领先的新经济产业第三方数据挖掘和分析机构iiMedia Research(艾媒咨询)授予的“中国户外羽绒服开创者”“企鹅·专注保暖服饰69年”双项市场地位确认
2025-08-07 15:47:00
全民健身日来袭!墨迹天气“AI 生活指数”守护全民健康,让运动更科学!
古语有言,冬练三九,夏练三伏。许多喜欢健身的人都将其奉为圭臬。然而,当运动健身逐渐成为全民共识,天气状况却常常成为人们体重管理计划外的“绊脚石”
2025-08-07 15:47:00
“永动力”品牌全面升级,永升服务打造物业行业“人才富矿”
当前,物业服务行业正面临新一轮转型升级,人才作为推动行业发展的核心动力,其专业能力和服务力直接决定了服务质量与客户满意度
2025-08-07 15:47:00
资管精细化时代,破解运营成本四大困局
在租金增长乏力与国资保值增值的双重压力下,资产运营类企业站在了从"粗放"向"精益运营"转型的十字路口。其中,运营成本的精细化管控成为关键突破口
2025-08-07 15:47:00
微信官方重申:无已读功能,以后也不会有
8月7日,微信官方重申,微信从一开始就没有已读功能,以后也不会有。“微信已读功能”这个话题,年年有人问,年年上热搜,年年在辟谣
2025-08-07 16:12:00
【宅男财经|专家面对面】据媒体报道,近日,时尚品牌ZARA的两则广告因模特看起来“瘦得不健康”在英国被禁播。当地监管机构裁定
2025-08-07 16:32:00