商汤,模型,升级,商汤,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

补齐Transformer规划短板又不放弃快速思考，Dualformer双重优势

一个 token 就能控制模型快些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

大模型步入推理Scaling时代,SambaNova如何挑战

...越人类专家。在性能跃升之外，更重要的是，它揭示了大模型进化范式的转变：通过更多的强化学习（训练时计算）和更多的推理（Test-Time 计算），模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多

2024-10-21 09:55:00英伟,霸主,推理,模型,地位,时代

全球科研团队竞逐低成本AI模型研发新范式

...外版美国斯坦福大学等机构研究团队近日宣布，在基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

Meta发布开源大模型Llama 4：首次采用“混合专家”架

...日)，美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 4，Llama 4目前有两个的版本，名为Scout和Maverick。Meta表示，Llama 4是一个多模态大模型，它能够处理和整合各种类型的数据，包括文本、视频、图像和音频，并且可...……更多

2025-04-07 06:44:00架构,混合,模型,专家,模型,人工智能

腾讯最强！混元自研深度思考模型T1正式发布：吐字快、能秒回

快科技3月22日消息，腾讯正式发布了自研深度思考模型混元T1正式版，这是腾讯自研的最强推理模型。腾讯表示，T1不仅吐字快、能秒回，还擅长超长文处理。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难...……更多

2025-03-22 00:29:00腾讯,深度,模型,推理,腾讯,模型

对标OpenAI o1！Kimi发布新一代推理模型：中考高考

...息，日前，国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型，采用全新强化学习和思维链推理技术，通过模拟人脑的思考和反思过程，大幅提升解决数学难题的能力。据...……更多

2024-11-18 08:22:00推理,新一代,模型,高考,模型,基准

成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型

...破，于近日全国首发基于扩散架构的人形机器人高速推理模型 R-DDIRM（Denoising Diffusion Implicit Robot Model）。这是继今年 5 月推出中国首个基于扩散架构人形机器人任务生成式模型 R-DDPRM（Denoising Diffusion Probabi……更多

2024-11-25 09:49:00成都,人形,机器人,推理,模型,机器

中兴通讯：全栈全场景智算解决方案，助力行业智能化转型升级

...发展新质生产力注入高效算力随着人工智能迅速发展，大模型的迁移成本和开发门槛成为影响AI创新的重要因素。为此，中兴通讯推出AI训推平台（AI Studio），简化创新之路、降低迁移成本。在中兴通讯南京滨江智能制造基地，...……更多

2024-07-05 07:17:00中兴通讯,场景,解决方案,升级,通讯,智能

亚马逊推出“自动推理检查”工具，对抗 AI 幻觉

...，亚马逊云科技（AWS）发布了一款新工具，旨在解决 AI 模型产生的幻觉问题。IT之家注意到，在拉斯维加斯举办的 re:Invent 2024 大会上，AWS 推出了“自动推理检查”（Automated Reasoning checks）工具，该工具通过交叉引用客户提供的...……更多

2024-12-05 10:41:00亚马,亚马逊,幻觉,推理,对抗,检查

云天励飞发布14nm Chiplet大模型推理芯片

...总经理陈宁介绍，DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片，采用自主可控的国产工艺，内含国产RISC-V核，支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载SAM CV大模型...……更多

2023-11-16 18:36:00云天,推理,芯片,模型,芯片,云天

阿里巴巴CEO吴泳铭：AI或改变物理世界！先进模型投入门槛将

...产生革命性的影响。在吴泳铭看来，技术方面，去年大模型还只能帮助程序员写简单的代码，但今年，大模型已经具备了文本、语音、视觉的多模态能力，能够开始完成复杂指令。早期受到诸多吐槽的“不会解数学题”问题也...……更多

2024-09-20 18:11:00阿里巴巴,阿里,美金,门槛,模型,投入

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开

...消息面上，今天，小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”，联动预训练到后训练，全面提升推理能力。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理...……更多

2025-04-30 23:41:00金山,异动,小米,推理,模型,金山

重磅升级！法大夫全面接入DeepSeek，打造中小企业数智法

...大夫云法务小程序已正式深度融合DeepSeek，全面接入其大模型，构建法律垂直领域AI服务新生态。通过“法律垂直模型+行业知识库+智能平台”的创新模式，深度整合DeepSeek的语义理解、逻辑推理及多轮对话能力等强大功能，并融...……更多

2025-03-07 11:54:00企业数,法务,重磅,管家,大夫,全能

对标o1，Kimi放出了最能打的国产模型

...性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时间，o1 将大模型的能力又往前推了一步。这段时间，国内大模型初创公司月之暗...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

继旗下xAI公司宣布正式开源大模型Grok-1后，特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚，马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上，马斯克在7月份就在X平台上确认，Gr...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

4月大模型排行榜出炉，文心一言大模型居首

...来发展的重要力量。而作为人工智能的核心技术之一，大模型在深度学习、自然语言处理等领域发挥着举足轻重的作用。然而，面对市场上琳琅满目的大模型产品，究竟哪家大模型最强？日前，鸥维数据基于superCLUE整理新增了"...……更多

2024-05-15 02:51:00模型,文心,排行榜,模型,文心,人工智能

商朝帝王档案，你了解多少

商汤子姓，名履，庙号太祖，为商太祖，河南商丘人。商朝的创建者，前1617－前1588年在位，在位30年，其中17年为夏朝商国诸侯，13年为商朝国王。今人多称商汤，又称武汤、天乙、成汤、成唐，甲骨文称唐、大乙，又称高祖乙...……更多

2024-06-13 11:10:00帝王,档案,太甲,国王,之子,祖乙

宋亭亭等：DeepSeek或催化中高阶智驾加速渗透

...家架构)以及MTP(多token预测)等多种技术手段，显著提升了模型性能和训练效率。这些技术不仅有望被各家企业借鉴，以加速智驾模型的训练速度并降低训练成本，还可能直接替代此前车企选择的VLM/VLA(视觉语言模型/视觉语言动作...……更多

2025-02-12 11:10:00亭亭,高阶,催化,模型,数据,训练

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型