革新,模型,范式,中文,推理,团队头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

曾忠燊，是一名潮汕人。其本科和硕士分别毕业于美国伊利诺伊大学和美国佐治亚理工学院。在本科毕业和硕士毕业之后，他曾先后在 IBM-Research 和深圳 IDEA 研究院工作过一段时间。在 ChatGPT 面世以后，他意识到针对大模型的研...……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

清华EconAgent获ACL 2024杰出论文：大模型智能

【新智元导读】近日，清华大学电子系城市科学与计算研究中心的研究论文《EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities》获得自然语言处理顶会 ACL 2024杰出论文奖（Outstanding Paper Award）……更多

2024-09-05 09:51:00革新,范式,清华,经济学,模型,智能

谷歌大模型推理范式，主要分为两个阶段

...出最新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...时刻。在22分钟完整版采访视频中，他们分享了自己对新模型的思考，以及背后的开发故事。OpenAI o1团队采访的完整版视频，终于上线了！全程22分钟，o1研发团队在项目Bob McGrew组织下，一起分享了「啊哈」时刻。有的人提到，...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

本周（4.8-4.14）AI界发生了什么？

...时间4月9日，谷歌、OpenAl、Mistral在24小时内，接连发布大模型重磅更新。谷歌正式发布了Gemini 1.5 Pro的多项更新，包括企业AI平台预览版本，首次上新音视频处理能力——最长可处理11小时的音频，或者1小时的视频。 OpenAl则又一...……更多

2024-04-14 20:33:00模型,特斯,马斯,芯片,融资,英特

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。团队主页：https://plms.ai/AI技术日新月异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

李开复辟谣「掉队」传闻，零一万物推「白菜价」顶级模型

AI「六小虎」分野，零一万物的牌面大模型发展到现在，我们应该关注什么？像 OpenAI o1 这样的技术新范式是其一；像 canvas、NotebookLM 这样的产品新思路也是；还包括用户、客户营收这样的商业化指标。目标多元，但资源有限。...……更多

2024-10-22 09:57:00李开复,白菜,传闻,万物,模型,顶级

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

近日，上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式：SLEICL（基于强模型增强的情景学习，Strong LLM Enhanced ICL），能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

联通元景大模型亮相2024年中国品牌日打造产业智能化新范式

...参与中国品牌日活动,并在联通展馆精彩亮相联通元景大模型,充分展示大模型的核心能力及对各行业的颠覆性影响。能说、擅听、会看的联通元景大模型联通展台前热闹非凡,参观者络绎不绝。联通一位工作人员以实操+讲解的方...……更多

2024-05-13 15:00:00范式,中国,模型,智能,产业,品牌

不同量级参数模型性能同样优秀夸克大模型再登行业评测榜首

【CNMO新闻】“大模型时代，夸克有巨大机会创造出革新性搜索产品。”11月22日，夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示，夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单，...……更多

2023-11-24 13:53:00夸克,模型,量级,榜首,评测,性能

Llama版o1来了，来自上海AI Lab，强化学习代码已开

复刻OpenAI o1推理大模型，开源界传来最新进展：LLaMA版o1项目刚刚发布，来自上海AI Lab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGo Zero的双重策略范式（先验策略+价值评估）。在2024年6月，o1发...……更多

2024-11-06 09:49:00上海,代码,学习,训练,模型,蒙特卡洛

清华团队提出新型光计算架构，光训练速度提升1个数量级

...天贶（来源：该团队）研究团队通过建立光子传播对称性模型，未采用传统的电训练反向传播范式，化“反”为“前”。这种新范式挣脱了前向-反向光场传播严格对齐的束缚，基于通用的光计算原位训练系统，突破了电训练架...……更多

2024-08-09 09:57:00量级,清华,架构,个数,团队,速度

商汤联合发布白皮书，首次提出新一代AI基础设施评估体系

...训练与推理、生成式AI与应用的基础设施激发“智能基建革新”,加速大模型和生成式AI落地《白皮书》以商汤基于AI大装置的多场景实践案例为例,阐述了从大型模型训练到生成式AI应用的全过程,再到区域智算中心的建设与运营,深...……更多

2024-01-02 21:30:00商汤,白皮,白皮书,基础设施,新一代,评估

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

从空间智能到具身智能，跨维践行Sim2Real AI最高效路

...其坚定信心及历史使命。以下为访谈实录：建立 “世界模型”触发机器人 “灵性”问：被誉为 “AI 教母” 的李飞飞教授首次创业即选择了 “空间智能” 方向，引发了对这一领域的广泛关注。可以谈谈您对空间智能和具身智...……更多

2024-07-23 09:40:00智能,路径,空间,智能,机器人,机器

大模型步入推理Scaling时代,SambaNova如何挑战

...越人类专家。在性能跃升之外，更重要的是，它揭示了大模型进化范式的转变：通过更多的强化学习（训练时计算）和更多的推理（Test-Time 计算），模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多

2024-10-21 09:55:00英伟,霸主,推理,模型,地位,时代

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多

...12日，人工智能（AI）巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列，包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍， o1会花更多时间思考问题，然后再做出反应，就像人一样。通过训练学会了完善自己的思考过程，尝...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

WOT全球技术创新大会2024北京站：探索AI 的无限可能

2024年过半，大模型、AIGC这场考试，你交卷了吗？成绩如何？大模型厂商们虽然把价格战“卷”出了白菜价——普通开发者或许会为低价疯狂，但企业用户关心的依旧是产品、应用与自身业务的匹配度；大模型是否能够真正解决...……更多

2024-05-31 18:24:00北京站,技术创新,北京,大会,全球,技术

金融大模型LightGPT升级版亮相

...项新技术，也将带来财富资管领域业务形态和逻辑范式的革新。 ……更多

2023-11-06 03:06:00金融大模型LightGPT升级版亮相

Bengio团队提出多模态新基准，直指Claude 3.5和

...想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较了结果监督（outcome supervision）和过程监督（process supervision）两...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

Microsoft Start Networks中国内容生态

...态正在加速重构。作为全球内容产业的重要参与者和体验革新者，微软在技术迭代下致力于构建强大的内容生态体系—— MSN ，赋能高质量内容的跨区域流动与创新。通过此次盛会，微软旨在联结更多用户及产业合作伙伴，深入...……更多

2024-05-23 15:24:00峰会,中国,生态,伙伴,成功,内容

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...费用降到0.2元。这有助于玩具制作、3D打印等行业的技术革新。腾讯地图基于腾讯混元3D大模型，发布了自定义3D导航车标功能。用户上传一张图，就能生成个性化的3D导航车标，比传统3D车标重建方案提速91%。后续，混元3D模型...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

Anthropic挖走DeepMind强化学习大牛、Alph

...者之一。《AI 重写排序算法，速度快 70%：DeepMind AlphaDev 革新计算基础，每天调用万亿次的库更新了》2024 年 7 月，谷歌 DeepMind 团队研发的 AlphaProof 和 AlphaGeometry 2 在 IMO 竞赛上共同实现了里程碑式的突破。AlphaP……更多

2024-10-30 09:54:00大牛,核心,作者,学习,学习,算法

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。（英伟达科学家Jim Fan、图灵奖得主Yann LeCun等参与讨论OpenAI的Q*实现方式）（Meta科学家田渊栋则认为Q*是Q-learning和A*的结合，且天然地适合推理任务，尤其在...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...和顶尖的技术人才，成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向，致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用，引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据