模型,参数,模型,基准,问题,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

3天把Llama训成Mamba，性能不降，推理更快！

...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

无惧限制 Intel为中国公司定制了一张AI大模型入场券

...有两层含义，一层含义是对正在四处寻找合适芯片的AI大模型算法公司来说，英特尔的Gaudi2能够成为这些公司发展业务的算力基石，足够的算力大模型竞赛的入场券。另一层含义是对于英特尔来说，拿出的能和英伟达最先进的H100...……更多

2023-07-14 15:42:00入场券,中国,模型,限制,公司,英特

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...和顶尖的技术人才，成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向，致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用，引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

谷歌DeepMind推Imagen2；ChatGPT Plu

...览本周AI领域涌现多项重要进展。Runway宣布开展通用世界模型研发，旨在通过研究通用世界模型改进其视频生成系统，使其更好地模拟现实世界的互动。谷歌Deepmind推出Imagen 2，一款高质量、逼真的人工智能图像生成器。Mistral AI...……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资

超级推理模型正面对垒：谷歌版o1发布次日，OpenAI o1

...源：硬AI圣诞节前，人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒，谷歌刚发布自家的先进推理模型挑战OpenAI的o1，第二天，OpenAI就推出了升级版的最强推理模型o3。美东时间12月20日周五，在为期12个工作...……更多

2024-12-21 09:15:00下一代,推理,正面,模型,模型,测试

AI落地千行百业，存储痛点凸显，浪潮信息如何助力AI向实？

AI时代，存储不仅是数据的栖息之地，更是AI模型训练、落地过程中的坚实底座。在AI开启的存储行业新周期中，众多厂商已将带宽等性能指标卷至新的高度。然而，这种追求似乎将AI这一复杂应用场景简单地“存储化”了。实际...……更多

2024-11-08 09:46:00浪潮信息,痛点,浪潮,百业,落地,存储

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...The Information 在最新的报道中披露，两位测试过「草莓」模型的人士表示，OpenAI 可能将在接下来的两周内发布「草莓」模型，并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本，「草莓」的目标是再一次让大模型...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

阿里云发布通义千问2.5，性能全面赶超GPT-4 Turbo

...里云正式发布通义千问2.5，阿里云方面表示，通义千问2.5模型性能全面赶超GPT-4Turbo。同时，通义千问最新开源的1100亿参数模型在多个基准测评中收获最佳成绩，超越Meta的Llama-3-70B。相比通义千问2.1版本，通义千问2.5的理解能力...……更多

2024-05-09 11:39:00通义,阿里,性能,通义,阿里,模型

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

近日，上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式：SLEICL（基于强模型增强的情景学习，Strong LLM Enhanced ICL），能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...的 AI 浪潮进入第三年，人工智能体（AI Agent）作为大语言模型（LLM）落地应用的关键载体，正受到学术界和产业界的持续关注。实际上，早在 5-6 年前，预训练技术就已经在许多实际任务中取得了显著成果。但 AI Agent 之所以在当...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

谷歌大模型推理范式，主要分为两个阶段

...出最新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

Intel为中国带来Gaudi2 AI加速器：超高性价比！

...，这是一个全民AI的时代。如果你不能张口ChatGPT、闭口大模型，都不好啥意思跟人打招呼。如果你不在AI上搞点东西，都不好意思说自己是科技企业。当然了，AI的历史其实相当悠久，远不只是对个话、做个图那么简单。无论是...……更多

2023-07-12 16:29:00加速器,超高,中国,性价比,加速器,模型

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...Yann LeCun 批评 LLM 的推文之一相反，他更注重所谓的世界模型（World Model），也就是根据世界数据拟合的一个动态模型。比如驴，正是有了这样的世界模型，它们才能找到更省力的负重登山方法。近日，LeCun 团队发布了他们在世界...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

【新智元导读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

谷歌和微软两位“印度老乡”CEO，正面硬刚

12月6日夜间，谷歌发布了其最新一代的AI大模型Gemini。谷歌的印度籍CEO Sundar Pichai亲自为这项发布站台，在公开信中将Gemini描述为：“我们迄今为止最强大、最通用的模型，它在许多领先的基准测试中都展现出了最先进的性能。...……更多

2023-12-08 16:29:00印度,微软,老乡,正面,模型,微软

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

...整报告。图源：OpenAI这个强大功能由即将推出的OpenAI o3模型的特制版本提供支持，该版本经过专门优化，适配网页浏览和数据分析场景。它能够运用推理能力，在互联网上搜索、解读和分析海量的文本、图像和PDF文件，并能根...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

非Transformer架构站起来了!首个纯无注意力大模型,

Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型不断出现，比如 Mistral 发布的首...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...引入思想链（CoT，Chain of Thought）的概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学、编码、科学等任务中，o1不仅比GPT-4o强上一大截，甚至比人类专家还要凶猛。OpenAI对此曾表示：通往AGI的路上，已经没有任何阻...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

商汤商量获SuperCLUE 9月评测总榜和子榜两项第一，A

...和子榜两项第一，AI智能体方向受瞩目近日，中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单，商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent（AI智能体）子榜中，SenseChat 3.0 同样...……更多

2023-10-13 14:26:00商汤,评测,方向,智能,模型,商汤

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...新闻网2023年4月17日，昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日，在“天工”大模型一周年之际，昆仑万维重磅宣布，“天工3.0”正式开启公测！“天工3.0”采用4千亿级参数MoE混合专家模型，并...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...转自：中国新闻网6月3日，昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑