透明度,推理,模型,思维,过程,升级头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

对标o1，Kimi放出了最能打的国产模型

...历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

创新，是从积累到突破的过程

...台、统建系统、数据中台均可调用DeepSeek的v3大模型和r1强推理能力，相关服务正在分批次向全体员工开放。同时，坚持筑牢风险防控屏障，完成安全护栏在DeepSeek应用上的防护，并结合Agent平台，逐步增强复杂任务推理能力。天...……更多

2025-02-18 12:26:00积累,突破,过程,管网,模型,场景

全球瞩目，又是杭州！这款视觉推理模型一夜起飞

...这个思路，我们开始思考：视觉模型是否也能实现类似的推理能力？”与传统大模型训练的 SFT（Supervised Fine-Tuning）方法不同，R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学，而R1方法则通过强化学习，...……更多

2025-02-26 07:07:00杭州,推理,模型,视觉,又是,全球

能看风水夸我有情趣 Kimi现在都这么野了吗

...何题，多少差了点意思。但这次的 k1 就有说法了，既有推理能力又有视觉能力，意思就是可以直接拍照上传解题，还号称能在数理化上打平甚至超越 Open AI 的 o1 。那要是这么比的话，咱可就来劲了。正好， k1 新模型现在也不...……更多

2024-12-19 00:21:00看风水,情趣,模型,能力,推理,更多

开放模型权重被指将导致AI失控，Meta遭举牌抗议

...径。有网友表示，开源有利有弊，既可以让人们获得更高透明度并增强创新，但也将面临恶意行为者滥用（如代码）的风险。不出所料，OpenAI 再次遭到了揶揄，「它应该回归开源。」对开源持有担忧的不在少数MIT AI 安全博士后...……更多

2023-10-08 18:12:00权重,模型,开放,模型,权重,安全

国内首个！百度文心大模型X1 Turbo斩获信通院最高评级证

...息，在5月20日的百度AI Day 上，中国信通院公布了大模型推理能力评估结果。百度文心大模型X1 Turbo在24项能力评估中，16项达5分，综合评级获当前最高级“4+级”，成为国内首款通过该测评的大模型。其中，文心X1 Turbo在逻辑推理...……更多

2025-05-21 07:20:00信通,文心,模型,证书,文心,模型

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...爆火，利用纯提示方法让普通LLM摇身一变，成为具备复杂推理能力的OpenAI o1。九月份，OpenAI o1正式登场。作为新一代的老大哥，o1系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

全球科研团队竞逐低成本AI模型研发新范式

...基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，但此类尝试意味着企业可以较低成本研发出适合自...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

提升金融服务智能化个性化水平

...展的过程中需要妥善避免科技伦理失范，比如隐私侵犯、透明度不足等问题。这些问题可能导致金融消费者权益受损、金融市场公平性受损。需要建立更严格的隐私保护制度，搭配解释性高、透明度高的算法以及策略规则，在保...……更多

2024-05-08 11:26:00金融服务,水平,智能,金融,个性,服务

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...73.56的高分，并在数理逻辑维度取得第一，体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出，数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型，聚焦多维度能力评估，包括基...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理，在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

对标OpenAI o1！Kimi发布新一代推理模型：中考高考

...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型，采用全新强化学习和思维链推理技术，通过模拟人脑的思考和反思过程，大幅提升解决数学难题的能力。据了解，在多项数学基准能力测试中，k0-math的...……更多

2024-11-18 08:22:00推理,新一代,模型,高考,模型,基准

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...方法直接教授模型安全规范，并训练它们在生成响应之前推理这些准则进，将安全原则融入推理过程中。整个过程分为两个阶段，第一阶段，监督微调（SFT）训练模型参考并推理安全规范，使用从基础模型生成的数据集。第二...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模

...，和网友猜测的一样，人工智能（AI）巨头OpenAI发布最新推理模型o3和o3-mini。前一天，OpenAI公司CEO山姆·奥特曼（Sam Altman）就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3？奥特曼表示是为了避免和英国电...……更多

2024-12-21 12:10:00推理,模型,直播,推理,模型,时间

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

国内首个通过主任医师评测的大模型，已在夸克AI搜索上线

...度越高、领先优势越明显的性能曲线，展现出在复杂医学推理任务中的突破。这揭示了在医学领域研发垂类模型的巨大潜力。夸克健康大模型以通义千问为基础，走出了一条面向垂直场景的深度工程化路线。“我们不是在训练AI...……更多

2025-07-23 15:07:00夸克,主任医师,医师,模型,评测,主任

AI产业化拐点前夕，百丽时尚解构「智能化」

...“某款产品为何滞销”的时候，AI可能会针对同样的数据推理出不同方向的解释，却很难穿透业务本质。问题的核心在于，无论是通用类模型还是垂类模型，都缺乏企业自有场景的规则锚点。这也就意味着，AI的能力上限需要以...……更多

2025-03-14 10:21:00拐点,智能,产业,时尚,业务,数据

DeepSeek助力旅游AI应用提升含“智”量

...提供了个性化服务。DeepSeek模型与“AI游贵州”的思维链推理思路高度契合。此次接入DeepSeek大模型后，“AI游贵州”将实现服务升级，游客不用再耗费大量时间和精力做旅行规划，也无需在众多景点、酒店、交通方式中进行筛选...……更多

2025-02-21 04:44:00应用,旅游,贵州,游客,旅游,马蜂

DeepSeek V3小版本大升级：推理、前端开发加强这些

...级带来的性能提升却相当显著，特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解，新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

超越ChatGPT：人类特有的思维要强化

...据驱动学习机制不可避免存在不可解释、数据依赖和逻辑推理弱等不足。忽略这些不足，可能会给全面认识ChatGPT带来一定的困扰。虚假关联带来隐患尽管ChatGPT可以“写”出人机莫辨的论文、诗歌，但当你尝试问它类似这样的问...……更多

2023-02-14 06:05:00思维,人类,思维,关联,教育,学习

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

o1核心作者分享：激励AI自我学习，比试图教会AI每一项任务

...绍下Hyung Won Chung，从公布的o1背后人员名单来看，他属于推理研究的基础贡献者。资料显示，他是MIT博士（方向为可再生能源和能源系统），去年2月加入OpenAI担任研究科学家。加入OpenAI之前，他在Google Brain负责大语言模型的预训...……更多

2024-09-21 09:36:00教会,核心,任务,作者,学习,模型

Claude 3大模型引起学界关注，业内人士：或将开启科研新

...进行，能够保证减少偏见、尊重隐私，以及提高安全性和透明度。另外，从训练 Claude 3 模型用到的数据和硬件来看，前者主要来自该公司的非公开内部数据、公开数据和第三方数据集，后者采用了由亚马逊 AWS 和谷歌云提供的硬...……更多

2024-03-12 10:59:00范式,学界,业内人士,模型,业内,科研

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

业界首款！中国联通发布元景思维链大模型：性能比肩OpenAI

...大慢思考能力，又具备不限于数学的多学科、多场景通用推理能力，且能做到针对不同任务和难度的自适应慢思考，大幅降低资源消耗。中国联通表示，主流榜单的测评结果显示，元景思维链大模型的表现超过了目前最好的通用...……更多

2025-01-24 12:33:00中国联通,中国,模型,思维,业界,性能

搜题更精准、难题都有解夸克“AI搜题”提升用户学习能力与效

...，孵化现象级产品。夸克“灵知”学习大模型实力强劲推理能力比肩OpenAI-o1大模型的出现，让夸克解决了很多长期存在的用户痛点，产品能力和服务水平也得到了全新发展。此前，有“学霸”之称的夸克大模型成功登顶C-Eval和...……更多

2024-11-01 11:51:00夸克,学习能力,难题,效率,能力,用户

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型