• 我的订阅
  • 头条热搜
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
AI智能体将迎爆发点,市场空间近300亿美元!中科金财6天5
...系统,以大型语音模型(LLM)作为核心引擎,基于复杂多模态数据的处理能力,他们可以感知环境,做出决策,并执行任务以实现特定目标。目前,国内外科技巨头都在加速布局AI智能体领域。其中,OpenAI计划在明年1月发布一款...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
2023年度“星河产业应用创新奖”揭晓,国网智研院、宝马等10家企业项目获奖
...模型打造的中学实验操作教考智评系统,实现实时采集多模态数据,进而评价实验操作并给出定量评价结果,目前AI 评分综合认可率可达到99.26%,已在广东省多所中学投入使用。在通用企业服务方面,中冶赛迪推出复杂项目流程...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
外媒:百度今年下半年将发布新一代人工智能模型
...5.0”进行升级,预计在多模型能力上实现显著改进。“多模态”人工智能可以处理文本、视频、图像和音频,并将它们组合在一起,也可以跨类别转换——例如,文本转换为视频,反之亦然。基础模型可以理解语言并执行广泛的...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
智谱AI再卷价格战:最低1毛线可买近200万tokens,相当于两本《红楼梦》文字量
...强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。同时,其通用能力提升达40%,超越Llama 3。Function Call函数调用能力提升40%,比肩GPT-4。智谱AI CEO张鹏表示,“2024是AGI元年,大模型技术增长没有放缓的趋势,Scal...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
...藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地...……更多
首个免费多模态大模型API:GLM-4V-Flash上线智谱开放平台
...技术普惠的理念,在今天上线备受期待的第一款免费的多模态模型——GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。这一多模态免费模型将进一步降低开发者在各个领域深入...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
马斯克:未来两年内AI或将比“最聪明的人类更聪明”【附人工智能行业发展前景预测】
...景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多
本文转自:文汇报 本报讯 国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”于昨天在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训...……更多
DeepSeek+百度千帆“双模”驱动,山东省交通运输厅完成多模态大模型部署
近日,山东省交通运输厅完成基于DeepSeek的多模态混合大模型本地化部署。依托在建的“山东省交通运输智慧大脑”项目,通过百度智能云千帆大模型平台接入DeepSeek大模型,适配山东交通运输实际业务需求,深度融合DeepSeek大...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
2024年教育硬件大爆发!5款经典产品,款款AI驱动
...之一,小度学习机Z30内置了首个文心大模型AI老师,在多模态文心大模型的AI赋能下,能够用“图画+视频+模拟作者”的三合一形式,引导学生更好地感受藏在古诗文里的意境,以一种新颖的方式来学习古文,激发学生的学习兴趣...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
更多关于科技的资讯:
一句话、一张图,共绘古祠新名片!陈家祠商圈标识及宣传语邀您来设计
为提升陈家祠商圈品牌形象与文化内涵,扩大商圈影响力,进一步彰显岭南文化商圈特色,打造文化消费新地标,现面向全社会公开征集陈家祠商圈标识(LOGO)及宣传语
2025-12-12 09:23:00
晚上6点半,杭州遥望科技大楼的直播间里,灯光亮如白昼。小五对着镜子最后检查了一下妆容,深吸一口气,走向镜头。五年前,她站在黑龙江齐齐哈尔的寒风中
2025-12-12 08:08:00
如果未来的高速公路能像人一样“思考”,预判几公里外的风险;如果跨海大桥有“专属医生”,能飞檐走壁进行体检;如果服务区不再只是简简单单的驿站
2025-12-12 08:09:00
河北新闻网讯(杨春辉)如何深化信贷业务专业化能力,推动一线员工全面掌握产品体系与营销策略,从而为“一池两新万企”行动提供坚实支撑
2025-12-12 06:53:00
12月10日-12日,由浙江传媒学院主办、浙江传媒学院实践教学与艺术创作中心协办的 “剧想天开”——《儿童剧人物造型设计创新人才培训》成果展在杭州时尚中心正式展出
2025-12-12 07:07:00
站在4K摄像机前,主播“俍一”落落大方,此刻她站在演播室里,但直播间的观众们看到的却是由AI实时生成的背景。这样的场景在以前是不可想象的
2025-12-12 07:08:00
家电业创新驱动拓蓝海
家电业正朝着绿色、智能化方向升级,既精准匹配消费者需求,也开拓了市场新空间从电视、冰箱、洗衣机的传统“三大件”到智慧互联
2025-12-12 07:14:00
今年“双12”,南京企业捧出主题多元、内容丰富的促消费活动,推动消费市场提质扩容据悉,今年南京将“双12”作为南京市“四季有约·暖冬跨年庆”促消费活动的重要节点
2025-12-12 07:14:00
在直播间买了商品退货难、赔付慢等情况一直是困扰消费者的难题,临近“双12”,由杭州高新区(滨江)市场监管局联合辖区内头部直播电商企业共同起草的团体标准《放心消费直播间管理与运营规范》(以下简称《规范》)正式发布
2025-12-12 07:38:00
鲁网12月11日讯近日,建设银行泰安分行高效推进网点服务数字化转型,顺利完成泰安花园支行、新泰向阳支行、新汶翟镇支行、东平白佛山支行等4家网点的排队机轻量化叫号模式试点改造
2025-12-11 14:40:00
意大利ICA意卡亮相大湾区设计论坛:以色彩、技术与资源,赋能设计师
2025年广州设计周于12月5日至8日盛大开幕,在广州保利世贸博览馆、广州国际采购中心及海珠国际会展中心三馆共18个展厅同时举行
2025-12-11 14:53:00
苏大课堂来了位虚拟数字人老师
近日,在苏州大学传媒学院副教授程曦的《新媒体运营》课堂上,迎来了一位与她外型一模一样的虚拟数字人老师,只要是关于课程中的问题
2025-12-11 14:57:00
中新经纬12月11日电 11日,“网信中国”微信号发布汽车行业网络乱象专项整治行动公开曝光第二批典型案例。近期,国家网信办会同工业和信息化部等部门持续开展汽车行业网络乱象专项整治行动
2025-12-11 15:10:00
鲁网12月11日讯走进建行青岛市分行瞿塘峡路支行,大堂经理正俯身协助客户核对账单、同步讲解线上查询技巧;城阳支行营业部里
2025-12-11 15:17:00
【儒商风采】德州市恩锋企业管理咨询有限公司董事长李媛媛:先做朋友,再做生意
鲁网12月11日讯(记者 赵洪斌 通讯员 赵慧)“让一个企业家在半小时内,向陌生人交底,说出自己公司的核心难题——这事儿
2025-12-11 15:17:00