• 我的订阅
  • 头条热搜
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
谷歌发布Gemini,机构看好多模态AI应用商业变现前景,软件ETF(159852)年内份额增长近1.5倍丨ETF观察
近日,多模态AI概念持续活跃。谷歌等科技公司也纷纷推出了新的多模态AI产品,大模型多模态化有望成为AI领域的热门趋势。综合多家机构观点,AI多模态模型的不断突破和加速落地,有望进一步打开AI应用商业化空间。截至12...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证 【盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证】财联社12月13日电,盛视科技在互动平台表示,公司基于多...……更多
中信证券:谷歌Gemini模型发布 AI进入多模态时代 【中信证券:谷歌Gemini模型发布 AI进入多模态时代】财联社12月7日电,中信证券研报指出,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemi...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...家王晓刚17日宣布,商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧8B模型首包延迟在300毫秒以内,推理速度40Tokens/秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
理想汽车多模态认知大模型Mind GPT正式上线 【理想汽车多模态认知大模型Mind GPT正式上线】财联社3月28日电,理想汽车今日宣布,全自研多模态认知大模型Mind GPT已正式上线,成为首个通过备案的汽车厂商自研大模型。(财联社...……更多
润建股份:公司曲尺平台开发的AI行业模型支持多模态 【润建股份:公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电,润建股份在互动平台表示,公司曲尺平台开发的AI行业模型支持多模态,多模态底座具备文生图...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段 【云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电,云鼎科技发布股价异动公告,...……更多
...12个重点领域,类型包含文本、图片、音频、视频等多种模态。其中,中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据集为国内首次公开...……更多
更多关于科技的资讯:
济宁能源融汇数易:为客户提供一站式数字服务
鲁网12月22日讯(记者 徐景春 周正杰)近日,记者来到济宁能源融汇数易采访,在融汇数易供应链综合服务平台监控中心,大屏幕上实时跳动着物流订单
2025-12-22 11:45:00
章剑华散文集《人生简史》新书出版分享会在南京召开
近日,由江苏散文学会主办的章剑华散文集《人生简史》新书出版分享会在南京召开,作家出版社有限公司董事长、社长鲍坚,江苏省作家协会原一级巡视员
2025-12-22 11:59:00
让AI有“情商” 具身情感智能平台在合肥发布
大皖新闻讯 随着人工智能技术的发展,“人机共生”已成必然。但是,当前绝大多数AI都严重缺乏“情商”,成为“人机共生”核心瓶颈之一
2025-12-22 12:04:00
从南京先锋书店的牛皮纸袋,到直播间里一句“想要治愈系书单”的即时回应,再到书店老板用盲盒一夜清空库存——图书盲盒作为将“纸质书”与“盲盒经济”糅合的产物
2025-12-22 12:14:00
友成基金会“香橙妈妈守艺计划”非遗创变营圆满落幕
2025年12月10日,友成基金会“香橙妈妈守艺计划”非遗焕新创变营在成都红仓·萌想星球107文创产业园开营。来自全国12个省市18区县的18位非遗受益人齐聚
2025-12-22 12:20:00
密切警企协作,米连科技以技术风控守护用户安全
在网络诈骗手段花样翻新、线上安全成为社会普遍关切的当下,营造清朗的网络空间需要社会各方的协同努力。作为在线情感社交领域的参与者
2025-12-22 13:20:00
景秀游戏《偃武》联动昆明市博物馆 让古滇文明触手可及
近日,景秀游戏旗下三国题材策略游戏《偃武》与昆明市博物馆正式启动“古滇文明数字复兴”计划,作为深耕数字娱乐领域的企业,景秀游戏始终希望以游戏为载体
2025-12-22 13:20:00
[摘要]随着人工智能技术的迅猛发展,高等教育正在经历深刻变革。这就要求高校在研究生培养模式上深化改革,大胆创新,积极推动人工智能(AI)技术在研究生培养中的融合路径与实践
2025-12-22 11:10:00
据媒体报道,今年以来,杭州知名“网红大楼”丽晶国际大厦——这座巅峰时期汇聚了近两万名主播与从业者、“一栋楼的GDP堪比一个县”的楼宇
2025-12-22 08:18:00
味蕾实验TASTELAB首次亮相引领零食行业科学化升级新征程
2025年12月20日,全新零食品牌味蕾实验TASTELAB在上海正式举办品牌发布会。本次活动以“让味觉被看见”为核心主题
2025-12-22 08:49:00
乌江榨菜全民创意共创:深度对话Z世代的品牌焕新
当传统品牌纷纷叩响年轻化的大门,仅靠历史底蕴已不足以触动Z世代的心。作为榨菜行业的领军者,乌江榨菜早已展开前瞻布局:从早年携手B站打破次元壁
2025-12-22 08:49:00
在保险行业向专业化、精细化、集约化发展的背景下,富德生命人寿以科技引领创新,积极布局集约化运营模式,构建起以总部为核心的全国理赔集中运营格局
2025-12-22 10:32:00
彰显实力!大咖素质训练营荣获“2025年度影响力教育品牌”奖项
近日,由新浪教育与微博教育联合主办的“新浪&微博 2025 教育盛典”于北京圆满落幕。大咖素质训练营凭借在素质教育领域的深耕积淀
2025-12-22 10:49:00
不用提前抢,西湖消费券带火实体商户:3天,星巴克黄龙广场店增收50%
作为促消费的首创实践,杭州西湖区“疯狂碰友日・西湖首发季”交出亮眼成绩单:首期三天,21 万市民参与“即碰即用”消费券活动
2025-12-22 10:49:00
近日,深耕青少年语言教育领域近十年的创业者徐萌,凭借其专业的课程体系与显著的教学成效,受到教育界广泛关注。徐萌毕业于中国传媒大学播音与主持专业
2025-12-22 08:49:00