推理,模型,思路,原理,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...较长的小说了。更重要的是，LLM真的能在这个长度上进行推理吗？近日，有两篇独立研究分别表明：长上下文水分很大！LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员，推出了一项针对性...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

探索终端操作系统领域AI大模型创新趋势 OpenHarmon

...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多

2023-11-06 14:46:00终端,模型,趋势,大会,领域,智能

NeurIPS 2024|水印与高效推理如何两全其美？最新理

... sampling）结合，在为大语言模型加入水印的同时，提升其推理效率，降低推理成本，因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上，给出了两种具体的结合方法，分别在水印检测效果和生成速度上达到了现有最...……更多

2024-11-22 09:49:00水印,推理,理论,水印,方法,投机

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

DeepSeek的能力，到底从哪里来？

...测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的，是它在训练方式上的简化。以往的模型在提升推理能力时，通常依...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

中兴通讯引领算力时代：投资智能计算基础设施与大模型训练推理

...于算力领域，并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域，大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多

2023-12-04 10:08:00中兴通讯,推理,基础设施,模型,设施,训练

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力，训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶，往往意味着人类智慧极限的突破。迄今为止，解决或协助解决高等级数...……更多

2024-06-14 11:54:00奥数,选手,数学,国际,数学,数学家

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

全球瞩目，又是杭州！这款视觉推理模型一夜起飞

...这个思路，我们开始思考：视觉模型是否也能实现类似的推理能力？”与传统大模型训练的 SFT（Supervised Fine-Tuning）方法不同，R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学，而R1方法则通过强化学习，...……更多

2025-02-26 07:07:00杭州,推理,模型,视觉,又是,全球

chatgpt低成本复现流程开源

...。相比原生PyTorch，单机训练速度最高可提升7.73倍，单卡推理速度提升1.42倍，仅需一行代码即可调用。对于微调任务，可最多提升单卡的微调模型容量3.7倍，同时保持高速运行，同样仅需一行代码。要知道，ChatGPT火是真的火，...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

本文转自：人民网-安徽频道4月20日，科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

OpenAI发布免费新品GPT-4o：可对音频、视觉和文本实

...方面尤其出色。GPT-4o可以在音频、视觉和文本中进行实时推理，接受文本、音频和图像的任何组合作为输入，并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入，平均为320毫秒，这与人类在对话...……更多

2024-05-14 16:45:00本实,和文,推理,新品,音频,对话

腾讯推出新一代快思考模型混元 Turbo S，将在腾讯元宝逐

...用的多个公开Benchmark上，腾讯混元Turbo S在知识、数学、推理等多个领域展现出对标DeepSeek-V3、GPT-4o、Claude3.5等业界领先模型的效果表现。表格中，其他模型的评测指标来自官方评测结果，官方评测结果中不包含部分来自混元内...……更多

2025-02-27 19:52:00腾讯,灰度,元宝,新一代,模型,腾讯

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...0美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示，在比较13.11%和13.8%时，13.11%是更大的数值。这是因为当比较两个百分数时，我们首先比较整数部分，如果它们相同，则比较小数...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

2024　ASC世界大学生超级计算机竞赛启动

...13日在上海大学举行的总决赛。预赛赛题主要聚焦大模型推理优化和渗流数值模拟两个技术领域。当前,随着大模型开发和应用的快速发展,对大模型推理性能和成本的优化受到业界重视。本届大赛的大语言模型推理优化赛题要求...……更多

2024-01-05 01:38:00竞赛,计算机,大学生,大学,世界,模型

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型

...型的参数可能超过数十亿，通常需要显存较大的GPU来加速推理过程。因此，越来越多的研究开始关注如何缩小模型，比如改进训练方法或使用适配器。该领域的一项主要技术被称为量化（quantization）。ML工程师Maarten Grootendorst撰...……更多

2024-08-01 09:38:00干货,可视化,模型,工程师,指南,工程

作业帮全系产品接入DeepSeek，与自研大模型实现深度整合

...智能硬件、智能图书、教育数字化等业务场景中正式接入推理大模型DeepSeek-R1，与自研作业帮大模型实现深度整合。后续，作业帮将进一步提升学习和推理模型的能力，适配不同的教育场景，为用户带来更优质的个性化学习体验...……更多

2025-02-13 19:48:00接入,深度,模型,作业,整合,产品

能看风水夸我有情趣 Kimi现在都这么野了吗

...何题，多少差了点意思。但这次的 k1 就有说法了，既有推理能力又有视觉能力，意思就是可以直接拍照上传解题，还号称能在数理化上打平甚至超越 Open AI 的 o1 。那要是这么比的话，咱可就来劲了。正好， k1 新模型现在也不...……更多

2024-12-19 00:21:00看风水,情趣,模型,能力,推理,更多

DeepSeek开源惠四方（科技名家笔谈）

...与OpenAI发布ChatGPT3.5相提并论。DeepSeek以高效率、低成本的推理模型和开源的商业模式走出一条发展人工智能的新路。坚持历史视角准确看待价值准确认识DeepSeek的价值和贡献，必须坚持历史视角，将其放在人工智能创新发展的...……更多

2025-02-24 05:52:00四方,名家,科技,人工智能,人工,智能

OpenAI直播第二弹！奥特曼2024年最大惊喜竟来自字节？

...行评分。最后，强化微调加强了模型在处理领域问题时的推理能力，并提升了在特定任务上的准确性。对于那些要求高精确性和专业知识的领域，强化微调将会发挥至关重要的作用。从OpenAI的官方演示中不难看出，强化微调的效...……更多

2024-12-09 09:53:00奥特,奥特曼,字节,直播,惊喜,模型

OpenAI发布GPT-4.5：情商高、更擅长骗其他AI打钱

...在GPT‑4.5的系统卡/说明书中，OpenAI表示，相比于之前的推理模型，GPT‑4.5并未引入7个全新的前沿能力，并且在大多数准备度能力评估中，其表现低于o1、o3-mini和深度研究模型。OpenAI也承认，相信推理会成为未来AI模型和核心能...……更多

2025-02-28 06:23:00情商,模型,推理,公司,方面,能力

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...市场瞬息万变，需要实时数据处理和决策支持，大模型的推理涉及到大量的矩阵乘法计算，对硬件的矩阵乘法计算能力提出较高要求，计算复杂性可能导致响应时间延迟，不利于实时应用。加之大模型训练和推理过程需要大量的...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

华为AI存储助力中国移动构建超大规模智算集群

...海量数据信息的投入。面对智算集群目前存在的可用度、推理体验等问题，华为推出业界首款AI存储——OceanStor A800，致力于成为支撑智算集群发展的关键基座。智算集群为千行万业发展新质生产力夯基筑石近年来，智能计算已...……更多

2024-12-19 18:16:00华为,集群,中国,中国移动,存储,规模

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

... Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持