巅峰,推理,模型,风云,模型,测试头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

阿里云CTO周靖人：全面投入升级AI大基建

...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系，让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础模型升级，...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

开源社区分水岭：Meta大模型Llama 3发布，参数最高或

...行业基准测试上展现了最先进的性能，提供了包括改进的推理能力在内的新功能，是目前市场上最好的开源大模型。在架构层面，Llama3选择了标准的仅解码（decoder-only）式Transformer架构，采用包含128K token词汇表的分词器。Llama 3...……更多

2024-04-19 15:58:00分水,分水岭,模型,参数,社区,模型

阿里云重磅升级全栈AI体系，一文看懂云栖大会技术发布

...7连发，在模型智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。2025云栖大会，阿里云CTO周靖人发布多项重磅技术更新在大语言模型中，阿里通义旗舰模型Qwen3-Max全新亮相，性能超过GPT5、Claude Opus 4等...……更多

2025-09-24 13:30:00一文,阿里,重磅,体系,大会,升级

反击OpenAI，谷歌放出最强悍大模型Gemini

...某些任务，例如描述图像，但难以处理更概念性和复杂的推理。其通过60页的相关技术报告证明，Gemini是一个真正原生的多模态大模型，因为从最初的预训练数据开始，Gemini就在针对不同模态的模型进行训练，因此其功能在每个...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

商汤科技与金山办公达成商业合作，“日日新”大模型补强办公软件

...直是大模型的痛点，理科领域需要高度的抽象思维和逻辑推理能力，并且要求非常精准的答案，作为计算机科学和信息技术领域的重要工具，代码能力被视作衡量大模型智慧的关键维度。事实上，在过去一年国产大模型如火如荼...……更多

2024-04-12 15:11:00商汤,办公,补强,金山,办公软件,理科

DeepSeek R2没等来，R1“小升级”发布：思考时间更

...其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。不过，当时有内部人士向记者坦言，该传言真实度不高。从目前的情况分析，DeepSeek或许将用此次R1版本的升级，取代R2版本的推出。尽管网友评测得出的...……更多

2025-05-29 15:55:00效果,升级,时间,模型,升级,版本

超越国际标准！中国电信AI大模型发布：解决九章算术难题

...科技1月25日消息，中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview，即将上线天翼AI开放平台。该模型采用强化学习训练方法，结合探索和反思范式，显著提升了逻辑推理和数学推导的准确性。在多项权威评测...……更多

2025-01-25 19:05:00中国电信,算术,国际标准,中国,难题,模型

“重创”美科技股后，DeepSeek除夕再发新模型，文生图测

...巨头幻方量化旗下大模型公司，1月20日，该公司正式发布推理大模型DeepSeek-R1。推出后不久，R1就凭借其开源的性质、大幅下降的售价和训练成本获得了广泛关注。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性...……更多

2025-01-28 09:10:00文生,科技股,模型,测试,科技,模型

自我纠错如何使OpenAI o1推理能力大大加强?北大MIT

...的技术，使得模型能够在最终确定回复之前，先检测自身推理的错误并纠正。在实际的执行过程中，这会用到一种名为思考标签（thinking tag）的机制。模型会在这个标签内部进行反思，直到它得到正确答案或认为自己得到了正确...……更多

2024-11-19 09:48:00推理,北大,团队,解释,能力,理论

挑战Scaling Law，Meta发布移动端350M小模型

...做个假设，如果把GPT-4（大约有1万亿参数）以50tokens/s的推理速度部署在生活中，你需要什么样的硬件？答案是1亿个H100 GPU。别说是移动设备了，家里都放不下。那如果降低标准，用LLaMA-v2 7B这样的模型，再加上8-bit量化呢？简单...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

ASC24超算大赛启动会在京举行，大模型推理等成为赛题

...在上海大学举行的总决赛。据悉，今年的赛题包括大模型推理优化、渗流数值模拟，以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了启...……更多

2024-01-07 19:35:00启动会,推理,模型,大赛,模型,上海大学

智谱AI推出第三代基座大模型可在手机上部署

...具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例，它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码，也可以成为程序员的帮手，让它帮助生成...……更多

2023-10-28 08:25:00三代,基座,可在,模型,手机,模型

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...复适配器进行微调，它们不会产生任何额外的内存使用或推理成本。关于适配器的大小，团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而，为了提供更多的灵活性，苹果提供了一套不同秩的精度恢复适...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

9.11和9.9哪个大？实测12个大模型8个都答错，Chat

...模型的短板，此前行业也多次讨论过大模型的数学和复杂推理能力较差，即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次，第一财经曾在6月报道过，根据司南评测体系OpenCompass的高考全卷测试，包括GPT-4在内，7...……更多

2024-07-17 11:56:00实测,模型,模型,数学,小数,问题

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

OpenAI迄今最大、最贵模型！GPT-4.5正式发布

...题方面发挥更大作用，并且模型的幻觉现象更少，但数学推理能力仍逊于o3-mini等推理模型。GPT-4.5是OpenAI最后一个“非思维链模型”，通过扩大预训练和后训练规模，提升了非监督学习能力，未来将作为推理模型的基础。不过目...……更多

2025-02-28 07:37:00模型,模型,用户,推理,能力,开放

DeepSeek本地化部署都干了啥？多家券商回应！

...发布了相关信息。国元证券表示，基于DeepSeek最新发布的推理大模型DeepSeek-R1，该公司近日已完成该模型在金融场景的本地化部署及适配性测试，计划将其深度整合至自主研发的智能服务平台“燎元智能助手”中。DeepSeek-R1将赋能...……更多

2025-02-08 19:30:00券商,多家,智能,证券,模型,场景

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成文本，那...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

全模态对齐框架align-anything来啦：实现跨模态指

...-Vision-11B 既准确地识别出了餐厅，还提供了细致的思考与推理过程。在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下，北大对齐小组愿开源数据、训练、模型、评估的全流程，为全模态对齐研究贡献力量。对齐框架...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...0美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

开源版OpenAI再出「神作」，小模型吊打Llama 3！M

...持高达128k上下文（目前在vLLM上为32k）。在知识、常识、推理、函数调用、效率等方面，为低于10B参数模型设立了新标杆。而且，Ministral 8B还有配备了滑动窗口注意机制（sliding-window attention），以实现更快和内存高效的推理。不...……更多

2024-10-23 09:56:00模型,边缘,革命,模型,指令,性能

AMD跑大模型终于Yes！MI300X对比NVIDIA H1

...根据The Information发布的评测报告，AMD的Instinct MI300X GPU在AI推理基准测试中的表现与NVIDIA的H100 GPU相当，显示出AMD在高性能AI计算领域的进步。这份评测报告由MLCommons提供数据，在测试中，AMD的MI300X GPU以及NVIDI……更多

2024-09-05 11:09:00逊色,模型,测试,评测报告,戈麦斯,领域