模型,参数,模型,基准,问题,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...的 AI 浪潮进入第三年，人工智能体（AI Agent）作为大语言模型（LLM）落地应用的关键载体，正受到学术界和产业界的持续关注。实际上，早在 5-6 年前，预训练技术就已经在许多实际任务中取得了显著成果。但 AI Agent 之所以在当...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

近日，上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式：SLEICL（基于强模型增强的情景学习，Strong LLM Enhanced ICL），能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

谷歌大模型推理范式，主要分为两个阶段

...出最新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...Yann LeCun 批评 LLM 的推文之一相反，他更注重所谓的世界模型（World Model），也就是根据世界数据拟合的一个动态模型。比如驴，正是有了这样的世界模型，它们才能找到更省力的负重登山方法。近日，LeCun 团队发布了他们在世界...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

【新智元导读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

...整报告。图源：OpenAI这个强大功能由即将推出的OpenAI o3模型的特制版本提供支持，该版本经过专门优化，适配网页浏览和数据分析场景。它能够运用推理能力，在互联网上搜索、解读和分析海量的文本、图像和PDF文件，并能根...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

谷歌和微软两位“印度老乡”CEO，正面硬刚

12月6日夜间，谷歌发布了其最新一代的AI大模型Gemini。谷歌的印度籍CEO Sundar Pichai亲自为这项发布站台，在公开信中将Gemini描述为：“我们迄今为止最强大、最通用的模型，它在许多领先的基准测试中都展现出了最先进的性能。...……更多

2023-12-08 16:29:00印度,微软,老乡,正面,模型,微软

非Transformer架构站起来了!首个纯无注意力大模型,

Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型不断出现，比如 Mistral 发布的首...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学、编码、科学等任务中，o1不仅比GPT-4o强上一大截，甚至比人类专家还要凶猛。OpenAI对此曾表示：通往AGI的路上，已经没有任何阻...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...引入思想链（CoT，Chain of Thought）的概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

商汤商量获SuperCLUE 9月评测总榜和子榜两项第一，A

...和子榜两项第一，AI智能体方向受瞩目近日，中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单，商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent（AI智能体）子榜中，SenseChat 3.0 同样...……更多

2023-10-13 14:26:00商汤,评测,方向,智能,模型,商汤

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...新闻网2023年4月17日，昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日，在“天工”大模型一周年之际，昆仑万维重磅宣布，“天工3.0”正式开启公测！“天工3.0”采用4千亿级参数MoE混合专家模型，并...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...转自：中国新闻网6月3日，昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑