• 我的订阅
  • 头条热搜
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...能(GMAI):GMAI 是指能够广泛应用于不同医疗场景下的多模态人工智能模型,其中大型语言模型常作为人机交互的纽带。采用多语言的医疗模型,替代以往以英语为中心的模型,能够充分利用全球多种语言的数据资源,从而扩展...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...内容可溯源的能力。目前主要针对图片、音频和视频等多模态内容,采用隐式水印方法建立互认机制。文本内容上的实现仍有一定技术难度,后续将持续有针对性地突破。 此外,计划将通过AI保险机制,为相关人员和单位给予...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...期版本,并接近最新版本的表现。此外,GLM-4还增强了多模态能力,其CogView3模型在多项评测维度上达到了DALL·E3的90%以上水平。智谱AI还发布了GLMs和GLM Store,为用户提供定制化的个人GLM大模型和模型应用商店。GLMs降低了大模型...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
工商银行联合腾讯云发布《中国金融生成式AI多模态内容鉴伪与安全防御白皮书(2025)》
...,金融行业在加速迈向“AI原生”时代的同时,也面临多模态深度伪造内容带来的新型安全挑战。利用生成式AI合成的语音、图像、视频与文本,已能够高度模拟真实身份与业务材料,对远程开户、线上信贷、大额交易授权等核...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
...7.21705项目地址:https://ali-videoai.github.io/tora_video/一、三种模态组合输入,精准控制运动轨迹Tora支持轨迹、文本、图像三种模态,或它们的组合输入,可对不同时长、宽高比和分辨率的视频内容进行动态精确控制。轨迹输入可以...……更多
2025上海车展:BBA等八成主流车企已接入豆包大模型
...入,智能座舱正从简单的功能堆砌向场景化、个性化和多模态的智能助手演进。火山引擎也在本次车展联合梅赛德斯-奔驰、上汽奥迪、长安马自达等官宣了基于豆包大模型合作的重点车型,如奔驰「纯电长轴距 CLA」在本次车展...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...学技术大学博士生方俊峰和所在团队开发的首个统一的多模态大语言模型分子交互学习框架——MolTC(Molecular inTeraction Modeling enhanced byChain-of-thought theory),为解决上述问题带来了新的曙光。目前,在多个数据集的 400000……更多
...国内人工智能独角兽企业月之暗面(Kimi)发布新一代多模态思考模型k1.5。利用长短转化技术,以长链式思考技术改进短链式思考模型,在短链式推理性能测试中,k1.5模型在数学、代码等方面大幅超越GPT-4o、Claude 3.5 Sonnet 等全球...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
如今的智能体,已经像人一样「浏览」视频了,国内就有
...研,我们在 Github 上发现了 OmAgent 这个项目,这是一个多模态智能体框架,提供了同样强大的视频问答功能。项目地址:https://github.com/om-ai-lab/OmAgentOmAgent 是什么OmAgent 是一个开源的智能体框架,支持简单快速地面向设备进行智能.……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
OpenAI打了个“响指”,AI Agent厂商重建护城河|36氪新风向
...“幻觉”问题、长时记忆的前后一致性问题,以及增强多模态的理解能力。不少从业者都对36氪表示,OpenAI开发者大会后,其他竞争者还有一段点对点突破技术难题的“缓冲期”,用技术解决方案去获客。比如,波形智能选择突...……更多
多款技术产品问世!山东省新型智慧媒体重点实验室亮点纷呈
...”“基于主流价值观的党媒算法研究”“基于AI技术的多模态内容风控研究”“基于区块链技术的版权确权研究”五个方向,深入开展底层技术攻关研究,力求探索出一条能够使主流媒体与用户重新建立“深度连接”,重塑核心...……更多
多模态能力的进化,是AI眼镜成为生活必需品的关键
AI 浪潮下,多模态能力成为 AI 领域,特别是 AI 眼镜行业的高频热词。不少专家坚信,这项技术是突破单一交互局限的关键,有望重塑 AI 眼镜的使用体验。所谓多模态能力,即整合视觉、听觉、语言、触觉等多维度感官数据,...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
...行业难题。海尔消费金融(简称“海尔消金”)创新引入多模态大模型,并使用大小模型协同机制,充分发挥大小模型的专业能力,构建了一套完整的活体照欺诈防控体系,能够更加精准地识别和防范风险。技术瓶颈催生创新需求...……更多
...推动了传统产业数字化转型;在技术层面,底层架构、多模态融合、端云协同及开源等技术持续优化,为大模型发展奠定了基础。《报告》认为,构建大模型的核心在于模型自身关键能力的打造与模型所属企业竞争优势的形成。...……更多
深耕AI框架创新土壤 华为打造开放计算生态
...参数量走向万亿级,序列长度迅速增长,模型结构走向多模态甚至全模态,模型计算过程从单模型单任务走向多模型多任务,深度学习和强化学习相融合……技术迭代加速演进,AI框架面临前所未有的挑战与机遇。“人工智能框...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
打开大模型的无限可能,云栖通道看AI产业应用
...:元神AI,同时展示了基于英伟达OrinX平台、通义端侧多模态大模型的智舱AI技术能力。元神AI旨在推动解决触控交互/命令式语音交互和APP服务带来的座舱体验不佳、服务使用低频问题,通过交互变革和服务重塑,加速智能座舱“...……更多
国内成立首个超级智能安全实验室
...人民网人民网北京3月31日电 (记者赵竹青)3月29日,多模态超级智能安全北京市重点实验室(Beijing Key Laboratory of Super Intelligent Security of Multi-Modal Information)在中关村论坛上正式对外公开。实验室依托中国……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
...国内领先星辰系列大模型,构建了语义、语音、视觉及多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。视觉大模型赋能100+城市治理下...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
提质降价,国产大模型加速奔跑
...主任工程师程莹认为,国产大模型技术在语言、视觉、多模态等领域持续突破,在文本、音频、视觉、3D等数据方面实现多模态统一,持续突破人工智能感知、理解和推理世界的能力边界。这些,拓展着大模型与各行各业融合的...……更多
更多关于科技的资讯:
厦门网讯(厦门日报记者 楚燕 通讯员 陈雯 李欣)在患者脑中植入电极片,设备就能实时解码患者意图,通过穿戴式设备帮助患者实现抬手
2025-12-24 08:04:00
太晓红摘要:金融科技的崛起对传统商业银行的经营影响极为深远,通过重塑其成本结构、拓展收入边界、优化资产质量,显著提升了传统商业银行的盈利能力
2025-12-24 06:39:00
杭州日报讯 近日,工信部发布50个全国中小企业数字化转型细分行业实践样本。公布的名单中,杭州作为首批中小企业数字化转型试点城市
2025-12-24 07:12:00
方毅、李晓军等分享实战经验杭州日报讯 大数据时代,大学生的创业之路如何启程?12月19日,在“共梦想·创未来”杭州大学生创业者赋能活动中
2025-12-24 07:12:00
中新经纬12月22日电 据国家市场监督管理总局网站消息,为严格落实获证生产企业质量安全主体责任,充分发挥CCC认证管理制度“事前发力
2025-12-23 08:07:00
日前,杭州市人民政府办公厅印发《关于支持类脑智能未来产业创新发展的若干措施》,提出了一系列措施支持类脑智能产业研发创新
2025-12-23 08:15:00
坚定信心 勇挑大梁·产业新亮点丨河北特色产业集群共享智造故事(八):产品设计共享给白沟箱包带来什么
产品设计共享给白沟箱包带来什么——河北特色产业集群共享智造故事(八)11月27日,白沟箱包数字化转型赋能中心工作人员(左二)向商户展示通过共享设计平台生成的效果图
2025-12-23 08:24:00
中旅酒店品牌焕新:以客户为中心诠释中国待客之道
当前,中国旅游市场正经历从高速增长向高质量发展的深刻转型。随着"体验经济"时代的全面到来,消费者的需求已超越简单的住宿与观光
2025-12-23 08:56:00
RGB-Mini LED、激光电视双料加冕,海信电视斩获音视频领域最高奖项
12月19日,中国电子视像行业协会在北京隆重举办了第二十一届中国音视频产业大会。会上对音视频产业取得的重大创新科技成果进行表彰
2025-12-23 08:56:00
中新经纬12月23日电 23日凌晨,快手方面对中新经纬表示,22日22时左右,平台遭到黑灰产攻击,目前已紧急处理修复中
2025-12-23 09:32:00
走进杭州西溪湿地,水道是这里的路网,船只是来往的车辆。船行鸟不惊、人过鱼不散,勾勒出一幅人与自然和谐共生的生动图景。林深处
2025-12-23 09:47:00
把资产交还给公众的人——专访闽籍网络大咖、阿里集团前副总裁卢维兴
近日,港股上市公司鼎石资本(00804.HK)发布公告,阿里集团前副总裁、阿里拍卖及阿里资产前总经理卢维兴出任联席主席
2025-12-23 09:55:00
全直营等八大服务优势加持 一嗨租车以高质量服务体系建设现代出行新生态
在国家深入实施扩大内需战略与绿色低碳转型的时代背景下,现代服务业正迎来高质量发展的关键时期。作为国民经济支柱产业之一,汽车租赁行业不仅是连接汽车制造与大众消费的关键纽带
2025-12-23 10:27:00
河北新闻网讯(田红伟)近日,邢台交建集团华赢公交公司依托自有运营数据与智能调度系统,与高德地图深化跨界合作,通过双方技术优势互补
2025-12-23 10:32:00
纽扣家庭教育获评国家级高新技术企业,以科技创新引领家庭教育
近日,纽扣家庭教育集团正式通过国家级高新技术企业认定,这一由科技部、财政部、税务总局共同监督管理的国家资质,标志着集团在核心自主知识产权
2025-12-23 10:47:00