模态,基准,弱点,团队,模型,任务头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...和平台的发展：1、以机械臂作为物理输入/输出设备的多模态大模型：VIMA、PerAct、RvT（英伟达）、RT-1、RT-2、PaLM-E（谷歌）、RoboCat（DeepMind）、Octo（伯克利、斯坦福、CMU）等；2、弥合 System 1（负责低级控制）和 System 2（负责高.……更多

2024-01-07 11:00:00斯坦,斯坦福,机器人,家务,成本,机器

阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更

...包括了更快的响应和更低的成本。全能模型则是指能将多模态混合的模型，在输入输出方面更加自由。黄斐认为，在模型之外，AI Agent（智能体）也是一个需要重点关注的领域：“未来的一段时间内，AI Agent一定也是一个比较火...……更多

2025-02-21 23:22:00通义,阿里,推理,实验室,模型,实验

马斯克的AI大模型登场

...用户每天为推特生产包括文本、图像、视频在内的巨大多模态数据库。在算力方面，之前有消息称，马斯克一次性从英伟达购买了1万个处理大型AI模型数据的GPU，总费用达数千万美元，或许就是为了xAI。xAI官网信息也显示，“xAI...……更多

2023-11-06 09:22:00马斯,马斯克,模型,人工智能,人工,智能

MiniMax进化论：一群「偏执者」的破浪前行

...包含复杂跳转逻辑、通过全面测试且没有bug的网页；在多模态方面除了支持长文本文件，也支持视频、音频、图片等理解能力，同时支持生成图文音并茂的作品；还能通过MCP扩展、来完成做动画、广告片、PPT等任务……MiniMax Agen...……更多

2025-07-02 13:31:00一群,进化论,偏执,进化,模型,技术

谷歌史上最强大模型！Gemini 2.0正式发布

...今为止功能最强的AI模型，带来了更强的性能、更多的多模态表现（如原生图像和音频输出）和新的原生工具应用。Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升，速度甚至达到了后者的两倍。支持图...……更多

2024-12-12 07:15:00模型,音频,模态,自然语言,文生,多语

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...示了AFM-server在HuggingFace OpenLLM排行榜V1，以及HELM-Lite v1.5.0基准上的结果。可以看到，AFM预训练模型有着强大的语言和推理能力，从而为后训练和特征微调提供了坚实的基础。后训练人类评估对于苹果AI的应用场景来说，人类评估...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

质量超越o1，UCSD张怡颖教授团队开源生成式AI工作流自动

...值线表示。下图展示了几个生成图的对比， 1) 人工画的基准图，2) 直接询问 OpenAI o1，3) 直接运行 MatPlotAgent 工作流，4) DSPy 优化过的工作流，以及 5) 由 Cognify 优化过的工作流。Cognify 优化过的工作流返回的结果几乎与基准图吻合...……更多

2024-12-05 09:43:00张怡,工作流,生成,教授,团队,质量

字节豆包大模型团队突破残差连接局限！预训练收敛最快加速80%

...认为，该成果具有广泛的应用潜力，可以推广到文音视图模态的不同任务上，包括多模态理解、生成基座模型等。5. 写在最后团队关注底层问题，尤其在 LLMs 和多模态方面，期望实现更多突破。更多团队技术研究进展，可以通过...……更多

2024-11-08 09:47:00残差,豆包,收敛,字节,模型,团队

人工智能光芯片“太极”发布

...量效率，首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。相关研究成果4月12日发表于《科学》。作为人工智能的“三驾马车”之一，算力是训练人工智能模型、推理任务的关键。倘若把大模型...……更多

2024-04-15 06:37:00太极,人工智能,人工,芯片,智能,智能

银河通用王鹤：用三维视觉小模型+基础大模型实现具身智能

...径。为什么这样认为。对此，王鹤在具身智能大会具身多模态大模型论坛上给出了解释，科技行者就这一演讲关键内容进行了不改变原意的整理：机器人从动嘴到动手有多难最近，具身多模态大模型非常火，我们看到了OpenAI和Fig...……更多

2024-04-15 10:13:00模型,三维,银河,视觉,智能,基础

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...动评分器 ( FLAMe-RM 和 FLAMe-Opt-RM）。在12个自动评分器评估基准中的8个基准上，FLAMe及其变体的自动评分性能优于用专有数据训练的GPT-4o、Gemini-1.5-Pro等模型。- 计算高效的多任务训练：引入了一种计算更为高效的方法，使用创新...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

姚班天才组队开发《完蛋！我被大模型包围了》续作！专为摸鱼爱好

...子工作室”，还有了大模型明星创业玩家阶跃星辰提供多模态和multi-Agent等大模型技术支持。上周简单内测后，现在上线微信小程序，搜索头号做题家，人人都能玩。好奇，自家后浪能把前浪拍死在沙滩上不？来揭开《我把大...……更多

2024-06-24 16:53:00专为,模型,爱好者,天才,开发,模型

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

...史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，让大模型的上限从「没法看」直接上升到优秀水平，不专门训练直接数学奥赛金牌，甚至能在博士级别的科学问答...……更多

2024-09-25 09:48:00饱和,规划,模型,测试,规划,能力

小米大模型：不搞军备竞赛

...片公司也在合作，共同推动端侧大模型的落地。未来：多模态经历过语言大模型的开发，我们其实已经把底层的坑都蹚过了，我们有能力去做更大参数的模型，但具体要不要做千亿或者万亿的大模型，更多还是从投入产出比的角...……更多

2023-11-08 18:13:00军备,小米,竞赛,模型,模型,小米

AI界新晋王者被曝抄袭、作弊、做假，脸都丢光了

...像与人类互动。由此，谷歌追随者高呼：“Gemini让原生多模态（即文本、声音、视频等模态）真正做到丝滑融合，发展原生多模态将成为未来主流路径！”视频发布不到一天，这位超级巨头却遭“打假”。彭博专栏作家帕米·奥...……更多

2023-12-20 00:10:00王者,抄袭,模型,万物,公司,数据

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Ma

....5 倍（如图 5 所示）。数据集评估本文在一系列标准学术基准测试中评估 Conba 性能，包括常识推理任务（如 HellaSwag、WinoGrande、ARC - E、ARC - Challenge）、阅读理解任务（如 BoolQ、QuAC）、聚合基准测试（如 MMLU、BBH），采用不同……更多

2024-10-16 13:34:00序列,架构,北大,混合,团队,性能

“3D视频版Sora”来了！

...-Diag和FV4D）方面都击败了此前的模型。结语：Stability AI多模态再添新布局Stability AI以文生图开源模型起家，在文本、视频、3D等多个模态上都有所布局。此次开源SV4D，是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多

2024-07-26 09:30:00视频,视频,模型,视图,生成,视角

RTX 40系GPU AI性能首测

...IAACE技术Demo，它突破了游戏中NPC角色互动的界限，采用多模态方法来展示NPC，将认知、感知和行为系统集成在一起，以实现身临其境的叙事效果。在活动现场NVIDIA也展示了新版本的ChatRTX，增加了更多的功能，在新版本中它加入...……更多

2024-05-04 17:17:00性能,生成,测试,创作,火星,图片

CMU&清华：让LLM自己合成数据来学习，特定任务性能同样大

...评估 SELF-GUIDE 的有效性，研究者从 Super-NaturalInstructions V2 基准中选择了 14 个分类任务和 8 个生成任务。研究者随机选择了一半任务用于超参数搜索，剩余的一半用于评估。在模型方面，研究者选择了 Vicuna-7b-1.5 作为输入生成、...……更多

2024-08-02 09:40:00清华,性能,任务,数据,学习,生成