数理化,模型,视觉,模型,视觉,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

快科技12月16日消息，今日，月之暗面国产大模型Kimi发布视觉思考模型k1，k1基于强化学习技术打造，原生支持端到端图像理解和思维链技术，并将能力扩展到数学之外的更多基础科学领域。k1已陆续上线最新版Kimi智能助手的Andro...……更多

2024-12-16 11:18:00数理化,模型,视觉,模型,视觉,训练

能看风水夸我有情趣 Kimi现在都这么野了吗

...视觉能力，意思就是可以直接拍照上传解题，还号称能在数理化上打平甚至超越 Open AI 的 o1 。那要是这么比的话，咱可就来劲了。正好， k1 新模型现在也不需要等内测， App 和网页版都能用上，话不多说，我们直接开整。上来...……更多

2024-12-19 00:21:00看风水,情趣,模型,能力,推理,更多

扩散模型训练方法一直错了！谢赛宁：Representatio

...」？他表示：「我们可能一直都在用错误的方法训练扩散模型。」即使对生成模型而言，表征也依然有用。基于此，他们提出了 REPA，即表征对齐技术，其能让「训练扩散 Transformer 变得比你想象的更简单。」Yann LeCun 也对他们的...……更多

2024-10-15 09:57:00模型,训练,方法,模型,训练,视觉

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型（VLM）——PaLI-3，该模型与相似的体...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...Yann LeCun 批评 LLM 的推文之一相反，他更注重所谓的世界模型（World Model），也就是根据世界数据拟合的一个动态模型。比如驴，正是有了这样的世界模型，它们才能找到更省力的负重登山方法。近日，LeCun 团队发布了他们在世界...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

类人神经网络再进一步！DeepMind最新50页论文提出Al

...提出了一种新框架AligNet，通过模拟人类判断来训练教师模型，并将类人结构迁移到预训练的视觉基础模型中，从而提高模型在多种任务上的表现，增强了模型的泛化性和鲁棒性，为实现更类人的人工智能系统铺平了道路。近年...……更多

2024-09-23 10:00:00神经网络,框架,层次,神经,视觉,人类

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

DeepSeek-VL2 开源：AI视觉模型迈入 MoE 时

...公众号昨日（12 月 13 日）发布博文，宣布开源 DeepSeek-VL2 模型，在各项评测指标上均取得了极具优势的成绩，官方称其视觉模型正式迈入混合专家模型（Mixture of Experts，简称 MoE）时代。IT之家援引官方新闻稿，附上 DeepSeek-VL2 亮...……更多

2024-12-16 09:33:00模型,视觉,时代,模型,图像,分辨率

阶跃星辰李璟：多模态是AGI的必经之路，视觉模型可按语言模型

...璟发表主题演讲《迎接视觉领域的GPT-4时刻》，分享了大模型技术和应用层面的思考。他表示，今年以来大模型厂商密集的模型发布，意味着追求智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要...……更多

2025-05-17 12:05:00模型,按语,模态,之路,必经,星辰

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

谢赛宁新作：表征学习有多重要？一个操作刷新SOTA，DiT训

...分认识并认可了表征学习的重要性，那么视觉领域的生成模型呢？最近，谢赛宁团队发表的一篇研究就拿出了非常有力的证据：Representation matters！扩散模型如何突破瓶颈？成本高又难训练的DiT/SiT模型如何提升效率？对于这个问...……更多

2024-10-23 09:55:00新作,速度,训练,学习,模型,训练

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。然而，CLIP 的文本处理能力被广...……更多

2024-11-28 09:59:00模态,教会,文本,升级,数据,模态

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航，北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

国网浙江电力：世界首个电力联邦学习国际标准获批立项

...力电力行业智能化转型。联邦学习是一种分布式人工智能模型训练技术。《基于联邦学习的电力视觉检测系统要求和框架》国际标准将联邦学习技术与电力视觉检测业务相结合，构建了一套分布式模型训练方法，能够有效解决数...……更多

2024-05-17 18:28:00电力,浙江,国际标准,联邦,标准,学习

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...构成威胁，Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为，苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为，开源模型加上移动设备的本地数据，即本地化的原生 LLM，...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

银河通用王鹤：用三维视觉小模型+基础大模型实现具身智能

...但很可能永远都达不到；有专家认为，大家对大数据和大模型关注度太高了，现在的人形机器人应该更多关注机器人本体。而关于具身智能，身为北京大学计算机学院前沿计算研究中心（CFCS）助理教授、博士生导师，同时又是...……更多

2024-04-15 10:13:00模型,三维,银河,视觉,智能,基础

微美全息（NASDAQ:WIMI)将迁移学习引入到语义分割模

...景理解、图像分析、机器人感知和图像分割等。语义分割模型是计算机视觉领域中的一种模型，旨在将图像中的每个像素分配给特定的语义类别。与传统的图像分类模型只能给整个图像分配一个类别不同，语义分割模型能够为图...……更多

2023-11-15 01:02:00语义,全息,高质量,模型,任务,学习

昆仑万维SkyReels团队正式发布并开源SkyReels-

...个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型，其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来……更多

2025-04-21 13:53:00万维,昆仑,团队,生成,视频,模型