商汤,模态,模型,业内,商汤,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...出了一种新颖的多步误差最小化（MEM）方法，用于生成多模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

微软新专利：构建多模态3d面部模型

...单，微软公司获得了一项新的专利，通过深度学习构建多模态3D面部模型，可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪，生成富有表现力的虚拟肖像》，该系统涉及处理器和存储系统，处理器负...……更多

2024-04-24 12:03:00模态,微软,面部,模型,专利,面部

网达软件：公司“视联网数字化智能平台”不涉及多模态模型

网达软件：公司“视联网数字化智能平台”不涉及多模态模型【网达软件：公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电，网达软件发布异动公告，近日市场对于AI视频生成、多模态模型等相关概念较为...……更多

2023-12-08 20:40:00网达,模态,模型,数字,智能,平台

云知声推出山海多模态大模型：实时生成文本、音频和图像

IT之家 8 月 26 日消息，云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多

2024-08-27 09:38:00模态,山海,实时,生成,模型,图像

杭州国资再出手加码投资国产大模型

...自己的模型算法GLM。2024年智谱从基座模型能力延展为多模态和Agent。智谱方面表示，2025年，智谱将发布全新大模型，包括基座模型、推理模型、多模态模型、Agent等，并将其开源。“DeepSeek开源周刚刚结束，期待更多国产技术接...……更多

2025-03-03 18:32:00杭州,模型,国产,投资,模型,杭州

【2025数博会】“月球科学多模态专业大模型V2.0”正式发

...行业大模型成果发布暨供需对接活动”上，“月球科学多模态专业大模型V2.0”正式发布，并将全面赋能“数字月球云平台”，加速月球科研与工程应用智慧化进程。“月球科学多模态专业大模型V2.0”发布现场。本次发布的V2.0版...……更多

2025-08-30 04:58:00月球,模态,模型,数字,科学,专业

给机器人装上大模型大脑，「若愚科技」获超5000万天使轮融资

文｜武静静编辑｜邓咏仪36氪获悉，多模态大模型公司「若愚科技」完成超5000万天使轮融资，本轮融资由东方精工领投，昆仲跟投，源合资本担任独家融资顾问。公司称，资金将主要用于产品研发，业务拓展以及团队搭建等方...……更多

2024-03-21 05:19:00机器人,融资,大脑,模型,机器,天使

2B多模态新SOTA！华科、华南理工发布Mini-Monke

【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的...……更多

2024-08-13 09:42:00模态,华南,专治,后遗症,理工,分辨率

深数所发布500个行业多模态算料集

...据交易所（以下简称“深数所”）发布了500个垂直行业多模态算料集，按照大模型应用的不同阶段（训练、推理、调优），有的放矢地提供数据源，让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多

2024-04-13 01:58:00模态,行业,数据,模型,模态,人工智能

“国产大模型第一股”冲刺IPO 杭州资本提前布局

...室的技术成果转化，智谱AI构建了覆盖预训练、推理、多模态及智能体的完整大模型矩阵。2025年4月，智谱AI发布新一代开源模型GLM-4-32B-0414系列，其中推理模型GLM-Z1-Air-0414的推理速度高达200 Tokens/秒（实测），成本仅为同类产品...……更多

2025-04-20 08:29:00杭州,布局,模型,资本,国产,模型

五连板苏州科达：公司的KD-GPT大模型相对于谷歌Gemin

...板苏州科达：公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别【五连板苏州科达：公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电，苏州科...……更多

2023-12-13 17:47:00科达,模型,模态,苏州,对象,服务

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

北大等出品，首个多模态版o1开源模型来了——代号LLaVA-o1，基于Llama-3.2-Vision模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...音乐理解和生成结合在一起的想法比较新颖，论文也是多模态大模型领域的先期工作之一。并且，除了大模型本身，我们提出的针对模型训练的数据集制作流程和整理的数据集，对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

国际首个，我国团队开发糖尿病诊疗多模态大模型 DeepDR-

...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM，成果于 2024 年 7 月 19 日在 Nature Medicine 发表（题为 Integrated image-based deep learning and language models for primary diabetes care）……更多

2024-07-26 09:27:00糖尿,模态,诊疗,糖尿病,模型,团队

arxiv研究人员：多模态ai模型存在安全隐患

...论文指出，包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。这项研究标题为《跨模态安全调整》（Cross-ModalitySafetyAlignment），提出了...……更多

2024-06-26 03:07:00模态,研究人员,隐患,模型,人员,安全

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

新智元报道编辑：LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...qizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

世卫组织：人工智能在医疗领域应用前景广阔

...内瓦1月18日电（记者曾焱）世界卫生组织18日发布的多模态大模型治理相关新指南说，人工智能在医疗卫生领域应用前景广阔，但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多

2024-01-20 00:19:00人工智能,人工,前景,领域,医疗,智能

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...候选选项、引入纯视觉输入设置）更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性能不断提...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

银行业拥抱DeepSeek：可用于哪些场景？如何保障数据安全

...科技”，近日，江苏银行成功本地化部署微调DeepSeek-VL2多模态模型、轻量DeepSeek-R1推理模型，分别运用于智能合同质检和自动化估值对账场景中，通过对海量金融数据的挖掘与分析，重塑金融服务模式，实现金融语义理解准确率...……更多

2025-02-11 09:32:00银行业,场景,保障,银行,安全,数据

新网银行“多模态深度神经网络风控模型体系”入选10项首批代表

...暨第一批人工智能应用场景发布大会上，新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”，彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多

2024-10-30 16:25:00新网,模态,神经网络,代表性,深度,模型

中国的F1与AI都有一股韧劲

...周迎F1中国站首秀，一场科技与速度的跨界对话赛前举行商汤科技董事长兼首席执行官徐立对话中国首位F1赛车手周冠宇（左）。本报记者陈龙摄 ■本报记者沈湫莎再过一周，24岁的上海小伙周冠宇就将迎来F1职业生涯的...……更多

2024-04-13 05:40:00韧劲,中国,冠宇,商汤,中国,赛车

蔚来nomigpt端云多模态大模型上线，回答各种奇妙问题

...12日消息，今日，蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线，新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持，用户可以实现一句话设定AI场景，回答各种奇妙问题，与用户进行有情感的趣...……更多

2024-04-14 00:13:00模态,奇妙,模型,问题,模态,升级

蔚来 NOMI GPT 端云多模态大模型上线

蔚来 NOMI GPT 端云多模态大模型正式上线，并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉，NOMI GPT是为NOMI打造的端云多模态大模型，基于自研的端云融合架构，拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多

2024-04-12 13:09:00模态,模型,模态,多维度,多维,模型

支付宝发布多模态医疗大模型：支持千亿级视觉识别

...快科技7月5日消息，在2024世界人工智能大会上，支付宝多模态医疗大模型正式亮相，成为国内首批多模态医疗大模型之一。据悉，该医疗大模型的基石，源自蚂蚁集团自主研发的蚂蚁百灵大模型，这一先进平台不仅拥有“视听言...……更多

2024-07-05 16:17:00模态,模型,支付,视觉,医疗,支持

大华股份：星汉大模型以视觉为核心支持多模态分析

...里!公司回答表示：公司星汉大模型是以视觉为核心的多模态大模型。不仅能对视频图片中的目标、场景和事件等进分析分析理解，还能根据用户提示完成特定分析功能，同时也支持文本等其它模态数据的理解，支持人机交互等...……更多

2025-01-10 15:48:00大华,模态,星汉,模型,视觉,核心

腾讯混元上线文生视频并开源，120秒内成片！还有提示词建议

...文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍，此次更新中，HunYuan-Video模型经历了四项核心改进：1、引入超大规模数据处理系统，提升视频画质；2、采用多模态大语言模型（MLLM），...……更多

2024-12-04 09:49:00文生,腾讯,提示,建议,视频,生成

阶跃星辰李璟：多模态是AGI的必经之路，视觉模型可按语言模型

...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要，是实现AGI的必经之路。”对大模型的下一步发展，李璟表示，阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习，提高模型...……更多

2025-05-17 12:05:00模型,按语,模态,之路,必经,星辰

马斯克 xAI 展示首个多模态模型 Grok-1.5V

...下旬推出 Grok-1.5 大语言模型之后，近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision（Grok-1.5V），不仅能理解文本，还能处理文档、图表、截图和照片中的内容。xAI ...……更多

2024-04-13 16:20:00马斯,马斯克,模态,模型,模态,模型