罗格,罗格斯,推理,模型,团队,概念头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

DeepSeek这么火，为何从未拿过风投机构一分钱？

...赖算力资源的预训练阶段竞争终结了，下一阶段的重点在推理，并将出现一批新公司，DeepSeek的出现也是必然，用更低的算力资源就可以实现同等甚至更高的效能。虽然这几年大模型发展速度很快，但我们并没有投资大模型项目...……更多

2025-02-11 19:42:00投机,从未,模型,投资,投资机构,项目

若愚科技推出九天机器人大脑，大模型总参数规模达130亿｜项

...翻译、思维链、工具使用等多种类型的指令数据, 在逻辑推理、关系推理、感知能力上都能呈现出较好的效果。基于自研的基于语言大模型和多模态大模型，若愚科技构建了多模态具身决策大模型，凭借人类世界通用知识和强...……更多

2023-12-26 09:36:00九天,机器人,大脑,模型,机器,参数

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...快科技4月30日消息，小米官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理

连发两款模型“补课”，百度AI成色如何？

...李彦宏，百度近日低调发布两款大模型——文心4.5和深度推理模型文心X1，免费。两年前的3月，百度发布了对标ChatGPT的文心一言。这是全球大厂中首个生成式AI产品，也让外界看到百度相对迅速的先手布局。不过，百度后来采取...……更多

2025-03-20 11:38:00成色,补课,模型,文心,模型,模态

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...“秋季发布”（9月至11月）要更早。上述报道称，专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题，但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力，希望通过近几个月...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

肖峰：DeepSeek加速AI大时代，哪些领域将迎来新增长点

...算领域也将因DeepSeek的兴起而受益匪浅。AI模型的训练和推理都需要强大的算力支持，随着AI应用的增多和普及，市场整体对于云端推理算力需求或将大幅增加。国内头部云计算公司陆续接入DeepSeek，有望推动云服务商算力租赁及A...……更多

2025-02-11 21:12:00长点,大时代,领域,模型,领域,应用

揭示Transformer「周期建模」缺陷！北大提出新型神经

...中的商业周期、物理学中的电磁波，以及数学运算和逻辑推理等。因此，在许多任务和场景中，人们希望对周期进行建模，以便根据以往的经验进行推理。尽管以 MLP 和 Transformer 为代表的基础模型已经取得了显著的成功，但是它...……更多

2024-11-27 13:34:00周期,缺陷,神经网络,周期性,北大,特征

全球首台！“悟空”杭州出世

...举一反三、融会贯通，可处理视觉、听觉、语言、学习、推理、决策、规划等各类任务。类脑计算即是将生物神经网络的工作机理应用于计算机系统设计中，构建像大脑一样的低功耗、高并行、高效率、智能化的计算系统。“悟...……更多

2025-08-05 22:18:00悟空,杭州,全球,悟空,拟态,神经

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...考虑到大模型和异构多芯发展趋势，为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片，飞桨与文心联合，在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说，动静统一的自动并行能...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

阿里QwQ-32B API接口服务上线国家超算互联网：零门槛

...联网官微获悉，本周，超算互联网平台上线阿里巴巴开源推理模型QwQ-32B API接口服务，现在用户可获得免费的100万Tokens。据了解，基于国产深算智能加速卡以及全国一体化算力网，平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国...……更多

2025-03-09 13:46:00阿里,门槛,接口,互联网,互联,国家

北大提出首个通用指令导航大模型系统 | CoRL 24

...兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法，然而在真实应用中，人类可能向机器人下达不同形式的指令，甚至混合类型指令，现有的...……更多

2024-09-13 13:38:00指令,北大,模型,导航,系统,导航

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...交互能力的核心是模型能够直接在语音模态上进行理解和推理，这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程：首先将输入语音内容转换为文本，其次利用大语言模型进行文本推理，最后利用...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

被认可的大模型价格战

...要减少幻觉，同时需要有强大的记忆能力、查文献能力、推理能力，如果把行业上能共识的能力都投射到做医生的标准中，那么这便可以成为一个指标——“人造医生”就是AGI。李大海则尝试从经济学的角度定义AGI。在他看来...……更多

2024-06-16 23:38:00价格战,模型,认可,价格,张鹏,模型

DeepSeek点燃AI赛道，指数布局正当时

...，DeepSeek也拥有卓越的性能，有效降低了AI模型的训练和推理成本，其V3模型仅耗费约558万美元，显著低于GPT和Llama系列。同时，DeepSeek模型开源进一步降低了AI应用开发与部署门槛，极大拓展了AI应用场景，让人们看到了人工智能...……更多

2025-02-08 11:13:00赛道,布局,指数,科创,人工智能,指数

OpenAI怎么了？11人创始团队如今仅剩3人，GPT-5也

...新AI模型。从Anthropic透露的信息看，该模型在研究生水平推理（GPQA）、编码能力（HumanEval）、文本推理（DROP）等方面的成绩均好于GPT-4o，但在数学问题解决能力上稍逊于后者。值得注意的是，Anthropic的核心成员几乎都是OpenAI原...……更多

2024-08-08 16:24:00开发者,团队,大会,开发,阿尔特曼,舒尔

李彦宏批“百模大战”：造成算力极大浪费开源模型并不万能

...源模型的能力，就需要更大的参数规模，这将导致更高的推理成本和更慢的响应速度。李彦宏表示，大多数应用场景并不适合开源模型，商业化的闭源模型才是真正有竞争力的。他指出，没有实际应用的基础模型，无论开源还是...……更多

2024-07-08 18:15:00成算,李彦,模型,大战,模型,李彦

理想的智能驾驶，到底「City 不 City」？

...人过去的经验和习惯所形成的直觉；系统 2 则代表了思维推理能力，人们需要借助思考和推理来处理复杂的问题和应对未知的场景。端到端模型主要用于处理常规的驾驶行为，从传感器的感知数据输入到行驶轨迹的决策输出只经...……更多

2024-07-17 10:49:00驾驶,理想,智能,理想,模型,系统

理想自研芯片进展曝光：在新加坡设立办公室，团队规模已超160

...芯片自研方面，理想同时在研发用于智能驾驶场景的 AI 推理芯片，和用于驱动电机控制器的 SiC 功率芯片。报道称，理想目前正在新加坡组建团队，从事 SiC 功率芯片的研发。在职场应用 LinkedIn 上，已经可以看到理想近期发布的...……更多

2023-11-22 09:21:00新加坡,芯片,进展,团队,理想,规模

冯骥吹爆国产AI大模型DeepSeek:太强了 6到不真实!

...列出了AI大模型的六项关键突破方向：1、强大。比肩O1的推理能力，暂时没有之一2、便宜。参数少，训练开销与使用费用小了一个数量级3、开源。任何人均可自行下载与部署，提供论文详细说明训练步骤与窍门，甚至提供了可...……更多

2025-01-27 08:32:00太强,模型,国产,模型,网易,中国

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...用混合专家架构，超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

年度生成式AI大会上海站公布最新嘉宾，报名进入最后阶段

...成热潮，多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世，带来的思维链CoT+强化学习这一新范式，正推动生成式AI迈入新的阶段。大语言模型仍在狂飙，但价格战、营销战硝烟燃起，融资热度正在降温。不过...……更多

2024-11-26 09:38:00上海站,上海,嘉宾,生成,阶段,大会

超强AI来袭！OpenAI最新AI模型 “草莓”即将上线，推

...但其实这个模型的能力可不容小觑，它能够通过多步骤的推理解决复杂的问题。根据《信息》网站的报道，“草莓” 模型将视为一种推理模型，这意味着它能够处理一些需要多步骤来完成的请求，比如解答难度较大的代数题，...……更多

2024-09-12 10:02:00推理,草莓,模型,能力,模型,草莓

亚马逊推出“自动推理检查”工具，对抗 AI 幻觉

...拉斯维加斯举办的 re:Invent 2024 大会上，AWS 推出了“自动推理检查”（Automated Reasoning checks）工具，该工具通过交叉引用客户提供的信息来验证模型的响应准确性。AWS 宣称，这是“第一个”也是“唯一”的针对幻觉的防护措施。...……更多

2024-12-05 10:41:00亚马,亚马逊,幻觉,推理,对抗,检查

潮声丨全国首上线的这个AI神器，如何让浙江新生儿赢在起点

...息，能实时检索最新的医学文献，生成诊断建议，并通过推理过程展示，帮助医生验证诊断的可靠性。作为“侦探”，它能实时检索最新的医学文献，生成诊断建议，并通过推理过程展示，抽丝剥茧地分析疾病在孩子身上留下的...……更多

2025-03-11 08:46:00潮声,神器,浙江,新生儿,新生,起点

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...Ovis在OpenCompass上的测评数据情况据介绍，Ovis能够在数学推理问答、物体识别、文本提取和复杂任务决策等方面展现出色表现。例如，Ovis可以准确回答数学问题，识别花的品种，支持多种语言的文本提取，甚至可以识别手写字体...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-

...想展示了其在端侧算力方面的最新创新成果 —— “联想推理加速引擎”。据了解，这款由联想、清华大学及无问芯穹联合研发的推理引擎，是专为高效AI PC推理而设计的软硬件协同优化平台，可以让一台普通PC的本地推理能力，...……更多

2025-05-07 11:10:00新技,推理,新技术,能力,推理,模型

华为联合WPS AI，见证昇腾大模型推理应用启航

...华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践，共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推理解...……更多

2024-07-08 11:01:00华为,推理,见证,模型,联合,应用

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开

...收涨14.2%，报7.4港元。消息面上，今天，小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”，联动预训练到后训练，全面提升推理能力。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上，MiMo仅用7B的参数规模，...……更多

2025-04-30 23:41:00金山,异动,小米,推理,模型,金山