商汤,模态,基准,模型,模型,能力头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

反击OpenAI，谷歌放出最强悍大模型Gemini

... CEO戴密斯·哈萨比斯在谷歌官网联名发文，官宣了最新多模态大模型Gemini 1.0（双子星）版本正式上线。这个上线时间早于外界猜测的明年1月，保密程度很高，仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

...榜首，再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中，通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V，这款模型已在多家企业落地；代码...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

OpenAI CEO又创办了一家AI健康公司

...点聚焦几大场景，还与高校等合作推动生态发展。（二）商汤发布日日新5.5及相关产品，多项测评超GPT-4o商汤发布日日新5.5，包括流式多模态交互的5o版本，多项测评超GPT-4o，还推出了端侧大模型和相关产品。商汤现场演示了...……更多

2024-07-14 13:19:00一家,健康,公司,模型,视频,应用

WOT全球技术创新大会2024北京站：探索AI 的无限可能

...有哪些？如何规避这些工具的弱点，发挥其最大的优势？商汤科技Copilot如何提高开发效率和创新能力？在快速发展的技术环境中，开发者如何适应并成为终身学习者，以保持其在行业中的竞争力和创造力？在AIGC时代的软件工...……更多

2024-05-31 18:24:00北京站,技术创新,北京,大会,全球,技术

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...qizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

北大等出品，首个多模态版o1开源模型来了——代号LLaVA-o1，基于Llama-3.2-Vision模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

首个多模态连续学习综述，港中文、清华、UIC联合发布

...址：https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...来自斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009年，李飞飞团队在CVPR上首...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

全模态对齐框架align-anything来啦：实现跨模态指

... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐，已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中，「有效加速」和「超级对齐」已经成为两个主要的发展动向，...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

...高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。多模态大语言模型（Multi-modal Large Language Models, MLLMs）以文本模态为基础，将其它...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

中文大模型最新评测出炉：腾讯混元国内第一！

快科技8月5日消息，在最新发布的中文多模态大模型SuperCLUE-V基准评测中，腾讯混元大模型获国内排名第一，稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力，即多模态理解，俗称“图生文”。多模态...……更多

2024-08-05 08:07:00腾讯,中文,模型,评测,模型,模态

云从科技从容大模型荣登中国大模型第一梯队

...有力证明。云从科技在综合评测权威平台OpenCompass的多模态评测领域中也取得了重大进展。最新评测结果显示，从容大模型在该体系中的平均得分为65.5，这一成绩使其跻身全球前三，超越了谷歌的Gemini-1.5-Pro和GPT-4v，仅次于GPT...……更多

2024-08-09 15:00:00模型,梯队,中国,从容,科技,模型

Bengio团队提出多模态新基准，直指Claude 3.5和

...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

特斯联完成20亿元D轮融资，国际国有资本双领投

...政府平台公司、徐州产业基金、北科建集团、光大控股、商汤科技等新老股东一同跟投。所募资金将用于完善具有多模态能力的领域大模型在园区、企业、经济、能源等多场景的应用，打造高灵活度、高性能的智算基础设施，构...……更多

2024-04-09 11:26:00特斯,融资,国有,资本,国际,特斯

前商汤通用模型负责人打造3D大模型「Tripo」，3D生成迈

在AI领域的持续创新中，3D建模一直是等待着自己的"ChatGPT"时刻。传统3D建模涉及游戏、影视、建筑等多个行业，其制作流程繁琐，生产周期长，成本高昂。每个3D模型的创建成本至少需要数千元，而生成式AI技术在2D图像生成方...……更多

2023-12-21 12:30:00商汤,模型,生成,负责人,项目,时代

$什么影响大模型安全？NeurIPS\'24新研究提出大模型越狱攻击新基准$

什么影响大模型安全？NeurIPS'24新研究提出大模型越狱

...融等关键行业，评估并保障这些领域中LLMs的安全性。多模态扩展：探索多模态数据的越狱评估，结合文本、图像、音频等多种数据类型，全面评估LLMs在多模态环境下的安全表现。协作防御机制：开发基于多Agent的协作防御机...……更多

2024-11-01 09:29:00模型,基准,攻击,影响,安全,研究

支付宝多模态医疗大模型正式亮相

...2024世界人工智能大会“可信大模型论坛”上，支付宝多模态医疗大模型正式亮相，成为国内首批多模态医疗大模型之一。据CNMO了解，支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多

2024-07-06 13:14:00模态,模型,支付,医疗,模态,模型

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？权威榜单，中文多模态大模型测评基准SuperCLUE-V，新鲜出炉：特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B，分别成为国内闭源和开源界两大领跑者，甚至超过Claude-3.5-Sonnet..……更多

2024-08-09 09:38:00模态,腾讯,国产,模态,腾讯,元宝