商汤,模态,基准,模型,模型,能力头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的1/360 | 最前线

...，来源于经过数据治理、多维评测的数据工厂。为了将多模态能力搬上了手机，面壁智能还发布了多模态端侧模型MiniCPM-V。通过将手机调整为飞行模式来模仿野外无信号的情况，面壁智能演示了野外生存情况下人与MiniCPM-V的多模...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

MiniMax进化论：一群「偏执者」的破浪前行

...包含复杂跳转逻辑、通过全面测试且没有bug的网页；在多模态方面除了支持长文本文件，也支持视频、音频、图片等理解能力，同时支持生成图文音并茂的作品；还能通过MCP扩展、来完成做动画、广告片、PPT等任务……MiniMax Agen...……更多

2025-07-02 13:31:00一群,进化论,偏执,进化,模型,技术

车企老总下场做IP的时代，AI大模型能改变营销内卷吗？

...，引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V，声称只花500美元训练，就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现，该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多

2024-06-06 13:44:00老总,模型,营销,时代,模型,汽车

人机共创｜商汤徐立：大模型推进数字人向智能化迈进

...形象背后，正是来自AI大模型技术的强大支持，并基于“商汤如影SenseAvatar”AI数字人生成平台创新打造。商汤科技董事长兼CEO徐立在分享时说：“我们希望用数字人的方式致敬和缅怀老一辈科学家，并激励更多年轻人投身科技创...……更多

2025-04-01 21:36:00商汤,共创,人机,模型,数字,智能

香港发布AI多模态手术大模型

...学院香港创新院AI中心”)，日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍，CARES Copilot系统由中国科学院香港创新院AI中心研发，是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多

2024-03-14 10:23:00模态,香港,模型,香港,中国科学院,人工智能

CVPR最佳论文被生成式AI占领，清华武大华南农大上科校友获

...并得到最终反馈标签。之后，设计了一种基于ViT和T5X的多模态Transformer模型RAHF，使用三种预测器预测上述丰富的人类反馈信息:使用卷积层和上采样层预测失真和不匹配的热力图使用卷积层和全连接层预测4个方面的评分使用Trans...……更多

2024-06-21 09:21:00华南,清华,农大,获奖,校友,生成

实体“贾维斯” vivo发布PhoneGPT：可自动打电话定

...能力，并带来vivo自研的语音大模型、图像大模型以及多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力，是国内最懂中文语境的图像模型之一，甚至还支持国风水墨，支持在图片生成过程中，增加汉字...……更多

2024-10-10 11:42:00贾维斯,贾维,实体,餐厅,模型,模态

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...合提出即插即用的SearchLVLMs框架，可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强，使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

哪里不会扫哪里！全球最强数学大模型在线玩，阿里多模态模型加持

...wen2-Math还是各自负责一部分。但不久的将来，我们会把多模态能力和数学推理能力结合到一个模型上哟。不少网友对这种交互模式挺买账：歪瑞古德！用图像来上传，然后等大模型解决问题，喜欢！那么，最强数学大模型Qwen2-M...……更多

2024-08-21 09:42:00模型,模态,阿里,数学,全球,在线

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...的创新框架。DiffSensei 集成了基于扩散的图像生成器和多模态大语言模型（MLLM），后者是一种文本兼容身份适配器。他们的方法采用了掩码交叉注意力技术，可无缝整合字符特征，从而在不直接传输像素的情况下实现精确的布局...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

科大讯飞大模型新升级：20秒制作PPT，拟人语音能力超越Ch

...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后，讯飞星火的文本生成能力和数理运算能力都有提升，可以轻松回答初三的数学物理题。现场演示中，对“前进20米、右转60 、反复...……更多

2024-01-31 07:32:00讯飞,拟人,语音,模型,能力,升级

AI界新晋王者被曝抄袭、作弊、做假，脸都丢光了

...像与人类互动。由此，谷歌追随者高呼：“Gemini让原生多模态（即文本、声音、视频等模态）真正做到丝滑融合，发展原生多模态将成为未来主流路径！”视频发布不到一天，这位超级巨头却遭“打假”。彭博专栏作家帕米·奥...……更多

2023-12-20 00:10:00王者,抄袭,模型,万物,公司,数据

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

...持下，360AI浏览器则可以对文本、视频、音频、图片等多模态的媒体内容进行分析处理，为用户提供了全方位的AI助手功能，绝对是不逊于 Copilot 的打工效率神器。视频内容也是如此，即使是长视频也能快速给出总结和内容描述...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

智源研究院发布FlagEval“百模”评测结果

...年下半年大模型发展更聚焦综合能力提升与实际应用。多模态模型发展迅速，涌现了不少新的厂商与新模型，语言模型发展相对放缓。模型开源生态中，除了持续坚定开源的海内外机构，还出现了新的开源贡献者。语言模型，针...……更多

2024-12-20 11:22:00评测结果,研究院,评测,结果,研究,模型

联通元景大模型亮相2024年中国品牌日打造产业智能化新范式

...供互联网实时资讯问答以及更好的数学计算等服务。在多模态大模型的视觉能力方面,工作人员分别提供了不同场景的视频和图片,“元景看见”迅速对视频、图像画面进行实时识别理解,并以文字描述方式呈现出来。除通用视觉能...……更多

2024-05-13 15:00:00范式,中国,模型,智能,产业,品牌

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...和案例大部分都是基于大语言模型。面向未来，他认为多模态大模型，抑或是文字、图片、语音、视频等多模态的融合，是基础模型非常重要的长期发展方向，是通往AGI（通用人工智能）的必经之路。而百度在这些领域有着长期...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

最强多模态模型GTP-4o问世，OpenAI继续开启人工智能

...性创新的今天，OpenAI公司隆重宣布，其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能，更在实时对话、图文分析等方面实现了质的飞跃，被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多

2024-05-14 14:04:00模态,之路,人工智能,人工,模型,智能

自动化、可复现，基于大语言模型群体智能的多维评估基准

...）也越来越强。因此，在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena，它通过收集用户对模型输出的偏好来对 LLM 进行综合排名。然而，随着 LLM 逐渐落地于众多应用场...……更多

2024-10-23 12:03:00多维,基准,群体,模型,自动化,评估

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》，借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果，以及赋能智能音频和数字安全方面的一些思考。首先，请允许我简...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

星火大模型v3.5发布，带来七大能力提升

...为教师的“AI助手”。据官方介绍，星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等特性。其内置“板书同步模式”，教师使用粉笔在智慧黑板旁边的传统黑板上书写时，板书内容可以同步...……更多

2024-01-31 04:11:00星火,七大,模型,能力,星火,黑板

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

...事实性以及推理能力的缺陷，实现更精细的语义理解、多模态（文本、图像、语音、视频等）输入和输出，具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能，实现AI的自我解释、自我评测和自我监督，构建...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

全面叫板OpenAI！谷歌发布多模态大模型全家桶：从AI助手

...先一天后，科技巨头谷歌不甘示弱，推出了自己的最新多模态AI（人工智能）产品。当地时间5月14日，在谷歌I/O开发者大会上的主题演讲中，谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo，...……更多

2024-05-15 09:54:00文生,模型,模态,全家,助手,视频

偷X数据用特斯拉显卡马斯克把AI炼成啥样了？

...个升级，就是新增了图片功能。但和其他家自己动手搞多模态 AI 不一样，这次马斯克倒挺罕见地选择了和别人合作。合作的对象，差友们应该还有点印象，就是前两天咱刚写过的 FLUX.1 。看到这，世超也没对 Grok2 的图片功能抱...……更多

2024-08-16 07:19:00特斯,马斯,马斯克,特斯拉,显卡,数据

全球几十种大模型评测，如何甄别可信度？

...秤）大语言模型评测体系，该评测体系覆盖语言模型、多模态模型、语音语言模型等多种模态，并针对不同模态设计相应的评测指标和方法。12月19日，智源再次发布了迭代后新版本的FlagEval，目前FlagEval已覆盖全球800多个开闭源...……更多

2024-12-23 13:44:00可信度,可信,模型,评测,全球,模型

AI大牛履新南大副校长！高校人工智能热度高涨，3年9名大厂科

...机科学系。何恺明本科就读于清华大学物理系，博士师从商汤科技创始人汤晓鸥，博士毕业后进入微软亚洲研究院工作。2022年7月，华为公司智能汽车解决方案事业部自动驾驶系统CTO、首席科学家陈亦伦离职，加入清华大学智能...……更多

2024-08-05 09:54:00大牛,大厂,大副,人工智能,热度,科学家

平安产险在ICDAR2025国际多模态理解竞赛中强势夺冠，连

...世界顶级赛事中，平安产险（参赛团队名称PA-VCG）在“多模态文档推理理解”这一高复杂度任务中，凭借领先的大模型技术体系与卓越的多模态理解能力，从全球众多顶尖科研机构与知名科技企业中脱颖而出，强势夺冠，连续4...……更多

2025-06-17 17:47:00模态,产险,国际,平安,顶尖,赛事

终于拿到内测！豆包-PixelDance真是字节视频生成大杀

...个面向不同细分领域（视频生成、音乐和同声传译）的多模态大模型，同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀：豆包视...……更多

2024-09-30 09:51:00豆包,字节,生成,视频,模型,豆包

考拉悠然：以多模态大模型为基深耕工业检测赋能产业升级

...外名校归国博士于2017年创立的企业，不仅在空间智能多模态世界模型领域稳居全国领军地位，更在工业检测等实体场景中展现出强劲的技术赋能能力。考拉悠然副总裁易国锋介绍道，作为全国大模型行业的标杆企业，考拉悠然...……更多

2025-08-04 14:04:00模态,考拉,悠然,模型,检测,升级

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...大招了！一连发布两大更新——Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。全新Le Chat：具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供！Mistral的CEO兼联创Arthur Mensch宣布道：「此次发布是...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成