模态,指令,框架,模态,模型,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

华中科技大学白翔教授发布多模态大模型

...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”，对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注：多模态大模型是一类可...……更多

2023-12-15 01:14:00华中科技大学,华中,模态,模型,教授,大学

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...能（GMAI）：GMAI 是指能够广泛应用于不同医疗场景下的多模态人工智能模型，其中大型语言模型常作为人机交互的纽带。采用多语言的医疗模型，替代以往以英语为中心的模型，能够充分利用全球多种语言的数据资源，从而扩展...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。然而，CLIP 的文本处理能力被广...……更多

2024-11-28 09:59:00模态,教会,文本,升级,数据,模态

AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布

...内容可溯源的能力。目前主要针对图片、音频和视频等多模态内容，采用隐式水印方法建立互认机制。文本内容上的实现仍有一定技术难度，后续将持续有针对性地突破。此外，计划将通过AI保险机制，为相关人员和单位给予...……更多

2024-07-25 09:26:00安全,信通,模型,评测,委员会,委员

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...期版本，并接近最新版本的表现。此外，GLM-4还增强了多模态能力，其CogView3模型在多项评测维度上达到了DALL·E3的90%以上水平。智谱AI还发布了GLMs和GLM Store，为用户提供定制化的个人GLM大模型和模型应用商店。GLMs降低了大模型...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

支付宝多模态医疗大模型正式亮相

...2024世界人工智能大会“可信大模型论坛”上，支付宝多模态医疗大模型正式亮相，成为国内首批多模态医疗大模型之一。据CNMO了解，支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多

2024-07-06 13:14:00模态,模型,支付,医疗,模态,模型

工商银行联合腾讯云发布《中国金融生成式AI多模态内容鉴伪与安

...，金融行业在加速迈向“AI原生”时代的同时，也面临多模态深度伪造内容带来的新型安全挑战。利用生成式AI合成的语音、图像、视频与文本，已能够高度模拟真实身份与业务材料，对远程开户、线上信贷、大额交易授权等核...……更多

2025-10-30 12:08:00模态,白皮,腾讯,白皮书,中国,防御

新网银行“多模态深度神经网络风控模型体系”入选10项首批代表

...暨第一批人工智能应用场景发布大会上，新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”，彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多

2024-10-30 16:25:00新网,模态,神经网络,代表性,深度,模型

阿里发“神笔马良版Sora”，轻轻一抹让猫咪转向，20个演示

...7.21705项目地址：https://ali-videoai.github.io/tora_video/一、三种模态组合输入，精准控制运动轨迹Tora支持轨迹、文本、图像三种模态，或它们的组合输入，可对不同时长、宽高比和分辨率的视频内容进行动态精确控制。轨迹输入可以...……更多

2024-08-05 09:34:00马良,神笔,阿里,猫咪,演示,报告

推动终端侧AI发展 MWC2024高通带来多项全球首发

...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型（LMM）。多模态指AI模型不仅能够接受文本输入，还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM，其支持文本、语音和...……更多

2024-02-29 10:14:00高通,终端,发展,全球,高通,模型

2025上海车展：BBA等八成主流车企已接入豆包大模型

...入，智能座舱正从简单的功能堆砌向场景化、个性化和多模态的智能助手演进。火山引擎也在本次车展联合梅赛德斯-奔驰、上汽奥迪、长安马自达等官宣了基于豆包大模型合作的重点车型，如奔驰「纯电长轴距 CLA」在本次车展...……更多

2025-05-14 04:44:00豆包,上海,车展,接入,模型,主流

月之暗面发布多模态思考模型k1.5

...国内人工智能独角兽企业月之暗面（Kimi）发布新一代多模态思考模型k1.5。利用长短转化技术，以长链式思考技术改进短链式思考模型，在短链式推理性能测试中，k1.5模型在数学、代码等方面大幅超越GPT-4o、Claude 3.5 Sonnet 等全球...……更多

2025-02-05 03:46:00模态,模型,链式,模态,模型,人工智能

科学家提出大模型分子交互学习框架，已在400多万分子对中验证

...学技术大学博士生方俊峰和所在团队开发的首个统一的多模态大语言模型分子交互学习框架——MolTC（Molecular inTeraction Modeling enhanced byChain-of-thought theory），为解决上述问题带来了新的曙光。目前，在多个数据集的 400000……更多

2024-03-07 10:44:00分子,科学家,框架,模型,验证,科学

努力开辟数字经济发展新赛道

...精细化标注水平，积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设，不断提升智能算力综合供给水平；稳步推进公共算力服务平台建设，...……更多

2024-03-20 05:57:00赛道,经济发展,数字,发展,经济,数据

如今的智能体，已经像人一样「浏览」视频了，国内就有

...研，我们在 Github 上发现了 OmAgent 这个项目，这是一个多模态智能体框架，提供了同样强大的视频问答功能。项目地址：https://github.com/om-ai-lab/OmAgentOmAgent 是什么OmAgent 是一个开源的智能体框架，支持简单快速地面向设备进行智能.……更多

2024-11-23 09:43:00智能,浏览,视频,智能,设备,模态

苹果公司公布“mm1”多模态大模型

...omMultimodalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

北大等出品，首个多模态版o1开源模型来了——代号LLaVA-o1，基于Llama-3.2-Vision模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

OpenAI打了个“响指”，AI Agent厂商重建护城河｜

...“幻觉”问题、长时记忆的前后一致性问题，以及增强多模态的理解能力。不少从业者都对36氪表示，OpenAI开发者大会后，其他竞争者还有一段点对点突破技术难题的“缓冲期”，用技术解决方案去获客。比如，波形智能选择突...……更多

2023-12-08 09:32:00护城,响指,护城河,风向,厂商,开发

多款技术产品问世！山东省新型智慧媒体重点实验室亮点纷呈

...”“基于主流价值观的党媒算法研究”“基于AI技术的多模态内容风控研究”“基于区块链技术的版权确权研究”五个方向，深入开展底层技术攻关研究，力求探索出一条能够使主流媒体与用户重新建立“深度连接”，重塑核心...……更多

2023-11-23 16:35:00山东省,山东,技术产品,实验室,亮点,智慧

多模态能力的进化，是AI眼镜成为生活必需品的关键

AI 浪潮下，多模态能力成为 AI 领域，特别是 AI 眼镜行业的高频热词。不少专家坚信，这项技术是突破单一交互局限的关键，有望重塑 AI 眼镜的使用体验。所谓多模态能力，即整合视觉、听觉、语言、触觉等多维度感官数据，...……更多

2025-04-08 17:49:00模态,生活必需品,必需品,进化,眼镜,关键

智源评测体系发布国内外“百模”评估结果出炉

...系，发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测，分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

多模态大模型赋能风控,海尔消费金融创新完善活体照欺诈检测新体

...行业难题。海尔消费金融(简称“海尔消金”)创新引入多模态大模型，并使用大小模型协同机制，充分发挥大小模型的专业能力，构建了一套完整的活体照欺诈防控体系，能够更加精准地识别和防范风险。技术瓶颈催生创新需求...……更多

2025-07-16 20:31:00模态,海尔,活体,模型,体系,检测

《报告》显示：2024年大模型领域呈现多元化发展趋势

...推动了传统产业数字化转型；在技术层面，底层架构、多模态融合、端云协同及开源等技术持续优化，为大模型发展奠定了基础。《报告》认为，构建大模型的核心在于模型自身关键能力的打造与模型所属企业竞争优势的形成。...……更多

2025-01-06 19:48:00模型,趋势,领域,报告,发展,模型

深耕AI框架创新土壤华为打造开放计算生态

...参数量走向万亿级，序列长度迅速增长，模型结构走向多模态甚至全模态，模型计算过程从单模型单任务走向多模型多任务，深度学习和强化学习相融合……技术迭代加速演进，AI框架面临前所未有的挑战与机遇。“人工智能框...……更多

2024-12-16 15:45:00华为,土壤,框架,生态,开放,框架

跨模态大模型“白泽”学会藏语

...新藏语内容理解与应用技术，人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后，显著提升了“白泽”对藏语内容的理解和处理能力，为网络空间藏语内容处理提供了全新的技术...……更多

2024-09-23 21:20:00藏语,模态,模型,藏语,模态,智能

打开大模型的无限可能，云栖通道看AI产业应用

...：元神AI，同时展示了基于英伟达OrinX平台、通义端侧多模态大模型的智舱AI技术能力。元神AI旨在推动解决触控交互/命令式语音交互和APP服务带来的座舱体验不佳、服务使用低频问题，通过交互变革和服务重塑，加速智能座舱“...……更多

2024-09-21 13:54:00模型,通道,产业,应用,机器人,模型

国内成立首个超级智能安全实验室

...人民网人民网北京3月31日电（记者赵竹青）3月29日，多模态超级智能安全北京市重点实验室（Beijing Key Laboratory of Super Intelligent Security of Multi-Modal Information）在中关村论坛上正式对外公开。实验室依托中国……更多

2025-03-31 11:35:00实验室,实验,智能,安全,智能,研究