• 我的订阅
  • 头条热搜
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
AI智能体将迎爆发点,市场空间近300亿美元!中科金财6天5
...系统,以大型语音模型(LLM)作为核心引擎,基于复杂多模态数据的处理能力,他们可以感知环境,做出决策,并执行任务以实现特定目标。目前,国内外科技巨头都在加速布局AI智能体领域。其中,OpenAI计划在明年1月发布一款...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
2023年度“星河产业应用创新奖”揭晓,国网智研院、宝马等10家企业项目获奖
...模型打造的中学实验操作教考智评系统,实现实时采集多模态数据,进而评价实验操作并给出定量评价结果,目前AI 评分综合认可率可达到99.26%,已在广东省多所中学投入使用。在通用企业服务方面,中冶赛迪推出复杂项目流程...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
外媒:百度今年下半年将发布新一代人工智能模型
...5.0”进行升级,预计在多模型能力上实现显著改进。“多模态”人工智能可以处理文本、视频、图像和音频,并将它们组合在一起,也可以跨类别转换——例如,文本转换为视频,反之亦然。基础模型可以理解语言并执行广泛的...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
智谱AI再卷价格战:最低1毛线可买近200万tokens,相当于两本《红楼梦》文字量
...强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。同时,其通用能力提升达40%,超越Llama 3。Function Call函数调用能力提升40%,比肩GPT-4。智谱AI CEO张鹏表示,“2024是AGI元年,大模型技术增长没有放缓的趋势,Scal...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
...藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地...……更多
首个免费多模态大模型API:GLM-4V-Flash上线智谱开放平台
...技术普惠的理念,在今天上线备受期待的第一款免费的多模态模型——GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。这一多模态免费模型将进一步降低开发者在各个领域深入...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
马斯克:未来两年内AI或将比“最聪明的人类更聪明”【附人工智能行业发展前景预测】
...景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多
本文转自:文汇报 本报讯 国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”于昨天在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训...……更多
DeepSeek+百度千帆“双模”驱动,山东省交通运输厅完成多模态大模型部署
近日,山东省交通运输厅完成基于DeepSeek的多模态混合大模型本地化部署。依托在建的“山东省交通运输智慧大脑”项目,通过百度智能云千帆大模型平台接入DeepSeek大模型,适配山东交通运输实际业务需求,深度融合DeepSeek大...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
2024年教育硬件大爆发!5款经典产品,款款AI驱动
...之一,小度学习机Z30内置了首个文心大模型AI老师,在多模态文心大模型的AI赋能下,能够用“图画+视频+模拟作者”的三合一形式,引导学生更好地感受藏在古诗文里的意境,以一种新颖的方式来学习古文,激发学生的学习兴趣...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
更多关于科技的资讯:
新闻纵深|“十四五 ”微记忆③:“丝网二代”的智造突围
阅读提示数智浪潮,奔涌而至。过去五年,人工智能等前沿科技,以不可逆转之势重塑千行百业。在安平,年轻的“丝网二代”逯千里
2025-12-17 08:09:00
国潮服饰消费热度 仍在上升
近期,在多地举行的时装周秀场上,马面裙等国潮服饰一经亮相就成为全场焦点;森马等传统服装品牌于近期宣布将推出国潮系列产品
2025-12-17 07:18:00
12月11日,我国自主研发的高空长航时多用途重型“九天苍穹”无人航空通用平台在陕西圆满完成首飞任务。这款性能位居全球前列的大型通用无人机横空出世
2025-12-17 07:35:00
记者走基层|手机没电没网 也能“硬核”付款
12月9日,雄安新区商务服务中心雄礼记商店内,市民孟令双(左)在手机关机的情况下,通过“碰一碰”完成购物付款。河北日报见习记者 康晓博摄“嘀”一声
2025-12-17 08:03:00
“2025年度十大新词语”16日发布,依次为:苏超、票根经济、杭州六小龙、现代化人民城市、育儿补贴、跨境支付通、对等关税
2025-12-16 14:07:00
中国联通三明分公司全力护航“音综王牌超级LIVE演唱会”通信网络畅通
开展专项通信保障工作东南网12月16日讯(通讯员 肖锦雯)密集的人流举起手机,试图捕捉舞台上的精彩瞬间,一场关于信号流畅度的保障已在观众看不见的地方悄然完成
2025-12-16 14:19:00
在国家大力推进现代化产业体系建设的宏伟蓝图下,科技创新与数字经济已成为驱动高质量发展的“双轮”。中国人寿财险江西省分公司主动融入时代潮流
2025-12-16 14:58:00
京东与国际铂金协会达成战略合作 成为其首个线上零售合作伙伴
近日,京东与国际铂金协会(PGI®)达成战略合作,成为其首个线上零售合作伙伴,双方将共同推动铂金首饰的线上消费体验升级
2025-12-16 15:17:00
服务“2030愿景”:中国AI营销平台王牌狮助推中沙数字经济务实合作
2025年12月11日,王牌狮团队在北京迎来沙特阿拉伯投资考察团,并进行了战略与技术交流。此次沙特投资考察团之行,重点关注以王牌狮AI营销智能体及建筑业垂直大模型阿拉丁ALDGPT为代表的中国数智化解决方案
2025-12-16 15:22:00
【宅男财经|专家面对面】对于近期AI换脸被滥用的问题,工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 18:16:00
济南市商务局携手阿里高德推“烟火济南支持计划”: 免商家开店费+精准流量扶持
鲁网12月16日讯12月16日,在高德扫街榜“烟火城市系列发布会·烟火济南”活动现场,济南市商务局、济南市工商联餐饮协会
2025-12-16 20:53:00
【宅男财经|专家面对面】泡泡玛特在国外广受欢迎,针对中国是否还会出现下一个LABUBU,中国广告协会会长、国际广告协会全球副主席张国华在接受宅男财经采访时表示
2025-12-16 21:57:00
雪博会最强指南!6.5折薅遍全球冰雪好物
12月18日至22日,第九届吉林雪博会将在长春东北亚国际博览中心举办,想一站式囤齐冰雪装备、淘遍特色好物?这份购物攻略请收好
2025-12-16 22:24:00
过去,客户经理找客户,靠的是跑园区、混商圈的经验和熟人脉;今天,打开“数智江南”App,就像打开了小微企业导航地图。这小小的转变
2025-12-17 00:05:00
江南时报讯 今年以来,泗阳农商银行坚持以客户为中心,将财富管理作为零售升级的重要方向,着力打造专业、规范、有温度的财富管理服务体系
2025-12-17 00:10:00