• 我的订阅
  • 头条热搜
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
麻省大学团队研发网格生物电子系统,为心脏组织工程提供新工具
...织的成熟度、区分药物效果、并能进行疾病建模。相比单模态传感器技术,通过本次感知平台可以打造出丰富的数据集。针对心脏组织功能、发育和病理生理状态,有望实现更准确的定量化结果,从而为改善心脏组织工程提供重...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...议关注券商、银行。(三)券商行业掘金 开源证券:多模态模型再迎新突破,继续布局AI应用及算力1、OpenAI发布首个文生视频模型Sora,可输出长达60秒的视频2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
被神话的 Sora ,被低估的多模态。Sora 终于来了!只要是 ChatGPT Plus/Pro 用户,直接就能用上。至于效果 ......看完官方放出的 demo,网友大呼:不太行 !当人们对「超级应用」的热情被 Sora 浇上一盆凉水时,多模态应用已经悄咪...……更多
中国科学家绘制全新猕猴脑网络组图谱 全球开放共享
...系统,能够有效整合多尺度脑图像和多组学信息,从而多模态跨尺度呈现猕猴脑部空间组织架构。作为一套描绘猕猴脑部空间组织架构的全景式脑图谱,全新猕猴脑网络组图谱还将克服现有图谱的诸多缺陷,包括仅针对特定解剖...……更多
大模型重塑智能硬件!人手一个智能助手的时代来了?
...一起聊聊烦恼、疑惑和心事……可以预见,更智能化的多模态大模型赋予了智能硬件新的生命。就在上周六,RTE 2024第十届实时互联网大会IoT分论坛圆满结束。多位AI智能硬件赛道的资深人士齐聚一堂,共同探讨如何让“智能硬...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
年轻人的好友列表,AI越来越多
...字人,还可以实时进行沉浸式语言、肢体互动。“以前多模态交互是一个连续生成过程,会有延时,Soul 现在语音对话延迟不到 200 毫秒,因为我们已经推出了端到端大模型能力——过去先生成文本/图像再转换为语音,现在能将...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
...、红外的热效应感知优势、可见光的高分辨优势,实现多模态特征融合感知,极大提升环境适应性、重点目标跟踪鲁棒性。通过本次实装挂飞,雷达光电一体化对地感知系统充分验证了多模态成像与一体化感知能力。据悉,下一...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品,实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业,打造 MaaS & AaaS产品与服务,为行...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
...城市峰会-青岛站会议上,依托在高性能云中心网络、多模态边缘网络方面的核心优势,聚焦公路、轨交、机场等不同领域数字化转型需求,发布了从底层架构到一体化云平台全面领先的——交通行业智慧化发展解决方案,覆盖...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实,人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势,行业专家们也给出了一些...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
王一刚:深耕技术产品,助力媒体融合
...中科闻歌雅意大模型在媒体领域的应用研究主要集中在多模态内容理解、关键信息提取、事件脉络分析、多模态内容生成和内容审校等方面,展现了在媒体领域的广阔应用前景。从业务视角来看,大模型可以在选题决策、辅助创...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
更多关于科技的资讯:
2025年以旧换新政策出炉:家电新增4个品类;手机、平板也有购新补贴
2025年消费品以旧换新政策出台,这次有哪些新品类进入补贴范围? 万众期待的2025年家电以旧换新政策终于出炉!1月8日
2025-01-12 16:23:00
海外媒体发稿:品牌出海先铸自身影响力“利剑”
品牌出海浪潮正当时在当今全球化的大背景下,品牌出海已然成为众多企业拓展市场、寻求新增长极的必由之路。随着世界经济格局的深度调整
2025-01-12 16:31:00
本文转自:人民网人民网北京1月12日电 (记者栗翘楚)近年来,生成式AI、大语言模型快速发展,医疗服务、医学影像诊断、药物研发等多个领域迎来深刻变革
2025-01-12 19:25:00
CINITY LED专属制版《刺猬索尼克3》放映,国产研发技术为电影带来了什么?
中国青年报客户端讯(中青报·中青网记者 沈杰群)日前,中影科技(北京)有限公司(简称:中影科技)在北京举办《刺猬索尼克3》CINITY LED制版首映影鉴会
2025-01-12 18:24:00
本文转自:人民网人民网记者 王绍绍近年来,“人工智能+”在与千行百业的深度融合中,不断拓展能力边界。从智能制造的自动化生产线到精准医疗的AI辅助诊疗
2025-01-12 19:25:00
法务部出击!Switch 2泄露厂商被任天堂找麻烦了
前段时间,配件厂商Genki在2025年CES展会上展示了一款Switch 2的实体模型,这引发了任天堂法务部关注。据报道
2025-01-12 10:22:00
CFO,全面接管中国互联网大厂
作者:徐晓倩过去一年,中国互联网的权力中心逐渐向CFO倾斜。2024年最后一天,盒马鲜生(以下简称盒马)新任CEO严筱磊宣布
2025-01-12 16:11:00
高速突现事故车 问界M7自动变道刹停!车主:华为智驾保我全家性命
快科技1月12日消息,近日,有问界M7 Ultra车主发布视频称,感谢赛力斯、华为智驾保我全家性命。车主公布的行车记录仪视频显示
2025-01-12 10:22:00
设计不会变了 蔚来萤火虫“三眼灯”确认:辨识度超高
快科技1月12日消息,在去年举办的蔚来NIO DAY上,蔚来第三品牌萤火虫首发,采用了非常独特的“复眼”大灯,这样的方案引发了不少争议
2025-01-12 10:22:00
本文转自:人民网人民网北京1月12日电 (唐佳)1月11日,中国国土经济学会低空经济专业委员会在京成立,并举行了低空经济与国土空间高质量发展论坛
2025-01-12 10:46:00
三轮车逆行全责撞上宾利 修车要几十万!宾利车主走代位追偿引热议
快科技1月12日消息,据报道,近日,浙江衢州,一位卖猪肉的老人开三轮车逆行下山,撞上了正常行驶的宾利欧陆GT轿车。事故现场照片显示
2025-01-12 10:52:00
福特电马突然变砖:婴儿一度被困车内、砸窗解救
快科技1月12日消息,海外媒体报道,近日,美国洛杉矶一辆福特电马电动门突然失灵无法解锁,导致车主9个月大的孩子被困车内将近1小时
2025-01-12 10:52:00
曝新款特斯拉Model Y九大产品核心亮点:舒适性提升占比超一半
快科技1月12日消息,毫无征兆,新款特斯拉Model Y就这样上市开卖了,仅提供两个版本,价格为26.35-30.35万元
2025-01-12 11:22:00
山火失控顶级富人区被烧毁:靠海的洛杉矶为何缺水灭火
1月12日消息,本月7日,美国加利福尼亚州南部地区突发山火,在大风助推下迅速蔓延,从加州南部的洛杉矶烧至好莱坞。好莱坞是富人聚集地
2025-01-12 11:22:00
2025年1月9日,微盟集团宣布推出“微盟X微信小店”系列解决方案,旨在帮助商家在微信小店生态中实现高效整合与业务增长
2025-01-12 11:52:00