李彦,模态,之路,必经,模型,场景头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

2B多模态新SOTA！华科、华南理工发布Mini-Monke

【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的...……更多

2024-08-13 09:42:00模态,华南,专治,后遗症,理工,分辨率

浪潮数字企业三款大模型产品入选济南市首批人工智能大模型推荐名

...工过程中涉及表格、文本、设计图纸、音视频等在内的多模态数据，支撑铁路工程施工知识进一步加工、梳理，进一步强化工程项目施工的标准与规范。浪潮海岳矿山大模型主要面向矿山场景下全过程智能化管理，包括行业专业...……更多

2025-06-24 17:14:00模型,济南市,济南,人工智能,浪潮,人工

中文大模型最新评测出炉：腾讯混元国内第一！

快科技8月5日消息，在最新发布的中文多模态大模型SuperCLUE-V基准评测中，腾讯混元大模型获国内排名第一，稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力，即多模态理解，俗称“图生文”。多模态...……更多

2024-08-05 08:07:00腾讯,中文,模型,评测,模型,模态

终于拿到内测！豆包-PixelDance真是字节视频生成大杀

...个面向不同细分领域（视频生成、音乐和同声传译）的多模态大模型，同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀：豆包视...……更多

2024-09-30 09:51:00豆包,字节,生成,视频,模型,豆包

谷歌发布Gemini，机构看好多模态AI应用商业变现前景，软

近日，多模态AI概念持续活跃。谷歌等科技公司也纷纷推出了新的多模态AI产品，大模型多模态化有望成为AI领域的热门趋势。综合多家机构观点，AI多模态模型的不断突破和加速落地，有望进一步打开AI应用商业化空间。截至12...……更多

2023-12-13 11:15:00模态,份额,前景,观察,增长,机构

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。然而，CLIP 的文本处理能力被广...……更多

2024-11-28 09:59:00模态,教会,文本,升级,数据,模态

国际首个，我国团队开发糖尿病诊疗多模态大模型 DeepDR-

...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM，成果于 2024 年 7 月 19 日在 Nature Medicine 发表（题为 Integrated image-based deep learning and language models for primary diabetes care）……更多

2024-07-26 09:27:00糖尿,模态,诊疗,糖尿病,模型,团队

依图科技“天问”大模型赋能安防，智慧应急跨越式发展

...防行业正经历着前所未有的变革。作为应用人工智能和多模态大模型的先锋领域，安防行业不仅展示了其强大的产业基础，更在发展新质生产力方面彰显出卓越的能力和潜力。依图科技，作为AI领域的先行者和创新者，多年来一...……更多

2024-05-22 15:00:00天问,安防,应急,模型,智慧,发展

文心大模型4.0正式发布李彦宏：与GPT-4相比毫不逊色

文心大模型4.0正式发布李彦宏：与GPT-4相比毫不逊色【文心大模型4.0正式发布李彦宏：与GPT-4相比毫不逊色】《科创板日报》17日讯，文心大模型4.0正式发布，开启邀请测试。百度创始人、董事长兼首席执行官李彦宏表示，在...……更多

2023-10-17 10:39:00李彦,文心,逊色,模型,李彦,文心

智源研究院发布FlagEval“百模”评测结果

...年下半年大模型发展更聚焦综合能力提升与实际应用。多模态模型发展迅速，涌现了不少新的厂商与新模型，语言模型发展相对放缓。模型开源生态中，除了持续坚定开源的海内外机构，还出现了新的开源贡献者。语言模型，针...……更多

2024-12-20 11:22:00评测结果,研究院,评测,结果,研究,模型

李彦宏直言开源模型是智商税！阿里云CTO：开源大大加速应用落

...技7月7日消息，在2024年世界人工智能大会上，百度创始人李彦宏直言不讳地表示，开源模型相当于一种“智商税”。他坚持认为闭源模型将保持领先，并强调即使是规模较小的闭源模型，其效果也优于同等规模的开源模型。李彦...……更多

2024-07-07 09:37:00李彦,阿里,智商,落地,模型,应用

李彦宏：过去18个月大模型领域最大变化是回答问题的准确性

10月16日晚，百度创始人李彦宏在《HBR Live：商业未来》与哈佛商业评论英文版总编辑殷阿笛（Adi Ignatius）对谈时表示，过去18个月，大模型领域的最大变化是回答问题的准确性。他还指出，未来5～10年，每个人都将拥有程序员的...……更多

2024-10-17 16:42:00李彦,模型,准确性,变化,领域,问题

大模型如何实现商业价值？小i机器人袁辉：与客户共创生态，落地

...型训练而成。包括文修图技术在内，文生图、图生文等多模态能力构成了华藏通用大模型的基础能力，亦是其商业变现的基石。小i机器人介绍，随着华藏生态共创的进程，已经趟出了一条由大模型到与客户及生态伙伴共创垂直...……更多

2023-11-01 10:02:00共创,机器人,落地,模型,生态,机器

文本、图像、点云任意模态输入，AI能够一键生成高质量CAD模

...同完成，是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计（CAD）生成大模型。计算机辅助设计（Computer-Aided Design，简称 CAD）软件是工业软件的重要分支，也是工业设计流程中的核心工具。然而，目前...……更多

2024-11-26 09:46:00一键,模态,高质量,生成,模型,图像

Sora刷屏视频出现多处失误模拟真实世界仍需闯关

...然OpenAI的明星效应为其带来大量关注，同日谷歌发布的多模态通用模型Gemini 1.5 Pro也变为配角，但不论是美国硅谷AI项目还是中国大模型创业公司，外界关注的核心均为实际应用效果。视频虽惊艳bug仍存在目前，Sora所生成的视...……更多

2024-02-19 09:37:00世界,视频,视频,模型,因果关系,因果

我市发布首批行业高质量数据集

...12个重点领域，类型包含文本、图片、音频、视频等多种模态。其中，中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据集为国内首次公开...……更多

2024-06-21 05:16:00高质量,数据,行业,数据,模型,海河

2025腾讯全球数字生态大会：腾讯云互联网行业“云+AI”全

...智能体开发平台、混元大模型，到图文、语音、视频等多模态处理能力，均已形成标准化能力封装，企业可基于RAG、Workflow与Agent框架快速构建专属智能体，嵌入旅游规划、内容生成、智能客服、用户服务等业务链路，全面提升...……更多

2025-09-17 14:25:00腾讯,行业,落地,生态,大会,互联网

“解锁”AI云盘新体验！中国移动云盘通过3项AI算法备案

...中，中国移动云盘3项大模型算法成功通过备案，涵盖多模态大模型、文本生成算法等。去年9月，中国移动云盘启动AI智能工具内测，本次算法备案成功标志着中国移动云盘可正式对外提供深度合成人工智能服务，在国内AI云盘赛...……更多

2024-04-18 23:03:00云盘,中国,算法,中国移动,体验,移动

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...zhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本