下一代,推理,模型,直播,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

谷歌发布gemma2大语言模型，共有两种大小

...亿参数（27B）两种大小。Gemma2大语言模型相比较第一代，推理性能更高、效率更高，并在安全性方面取得了重大进步。谷歌在新闻稿中表示，Gemma2-27B模型的性能媲美两倍规模的主流模型，而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多

2024-06-28 10:18:00模型,大小,语言,模型,性能,英伟

能看风水夸我有情趣 Kimi现在都这么野了吗

...何题，多少差了点意思。但这次的 k1 就有说法了，既有推理能力又有视觉能力，意思就是可以直接拍照上传解题，还号称能在数理化上打平甚至超越 Open AI 的 o1 。那要是这么比的话，咱可就来劲了。正好， k1 新模型现在也不...……更多

2024-12-19 00:21:00看风水,情趣,模型,能力,推理,更多

华泰证券：DeepSeek或带来中美科技资产重估

...目前北美四大AI公司主要通过扩大GPU集群规模的方式探索下一代大模型，DeepSeek能否在下一代模型研发中生效有待观察，DeepSeek的出现不会改变美股AI公司的中长期叙事逻辑，回调到位后有反弹机会；3）但DeepSeek的推出显著缩小了...……更多

2025-02-05 09:55:00华泰,中美,资产,证券,科技,科技

GPT-4下岗了，上海高校和企业用DeepSeek开发大模型

...相对低配的GPU和显卡内存，就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后，这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数，激活参数为370亿，在14.8万亿token（词元）上进行了预训练，生成速度比...……更多

2025-01-29 21:29:00上海,下岗,模型,智能,开发,企业

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4。而在数学推理方面，Qwen-72B在GSM8K、MATH测评中也领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力也有质的飞跃。△72B模型做数学题 ……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

空天信息+人工智能中国科研团队成功研发遥感智能训推一体机

...发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院供图“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型，能够在自然资源、...……更多

2023-10-27 16:57:00空天,智能,遥感,人工智能,一体机,中国

OpenAI发布免费新品GPT-4o：可对音频、视觉和文本实

...方面尤其出色。GPT-4o可以在音频、视觉和文本中进行实时推理，接受文本、音频和图像的任何组合作为输入，并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入，平均为320毫秒，这与人类在对话...……更多

2024-05-14 16:45:00本实,和文,推理,新品,音频,对话

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

...」。模型升级：Baichuan4-Turbo两张4090即可部署，Baichuan4-Air推理成本下降99%接下来，如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中？从名字中不难看出，它们都是Baichuan 4系列基础模型的升级。对于企业来说，在不同场景阶段……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本

新物种？联想Tech World 2024：AI的一切才刚刚

...我们期待与联想这样的行业领导企业一起创新，共同打造下一代AI PC，为用户带来智能的个性化体验。”联想倡导混合人工智能框架，是公有大模型和私有大模型的混合。大模型发展的下一步是基于大模型的智能体。联想集团高...……更多

2024-04-18 13:56:00物种,智能,人工智能,人工,杨元庆,联想集团

真香！智谱大模型，有了首个免费的API

...同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，使用 10...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

ChatGPT一周年，机会在大厂还是小公司？

...到两个月，你们有没有看到特别激动人心的大模型，赋能下一代的产品生态？或者是产品应用？王小川：今年是元年，刚刚开始，在情感陪伴里面大家看到一些成绩。我们公司既做模型，也做应用，内部的医疗模型确实能够更好...……更多

2023-12-07 09:42:00大厂,还是,机会,公司,模型,王小川

综述｜5月全球人工智能领域新看点

...版本升级，当前版本为DeepSeek-R1-0528，模型的思维深度与推理能力显著提升。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化，能够输出篇幅更长、结构内容更完整的长篇作品，同时呈现出更加贴近人类偏好的写...……更多

2025-06-02 13:09:00人工智能,看点,人工,领域,智能,全球

「学术版ChatGPT」登场！Ai2打造科研效率神器Open

...78%～90%。检索增强（retrieval-augmented）的语言模型可以在推理时检索并集成外部知识源，从而缓解上述问题。然而，许多此类系统依赖于黑盒API或通用的LLM ，既没有针对文献综合的任务进行优化，也没有搭配适合科研的开放式...……更多

2024-11-27 13:33:00神器,文献,效率,科研,学术,模型

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

OpenAI并未让DeepSeek惊出一身冷汗

...penAI开始后发补足自身在Agent能力上的探索。其中，o3作为推理模型，在编程、数学、科学、视觉感知等多个维度的基准测试中都刷新了纪录。比如在Codeforces、SWE-bench、MMMU基准测试中，视觉任务准确率高达87.5%，而MathVista达到75.4%...……更多

2025-04-17 23:25:00冷汗,一身,模型,图像,人士,能力

亚马逊云科技最强AI硬件猛兽背后，工程细节详细解读

...其首款自研AI芯片是2019年的Inferentia，能够切实降低小型推理工作负载的成本，比如亚马逊Alexa通过迁移到Inferentia节省了大量资金。2022年，亚马逊云科技推出了其首款自研AI训练芯片Trainium1，并实现可将在Trainium1上运行的工作负...……更多

2024-12-16 09:15:00亚马,亚马逊,猛兽,细节,背后,硬件

后摩智能“端边大模型AI 芯片”闪耀2025世界人工智能大会

...动终端在脱离了“云端”的情况下，依然具备本地大模型推理能力。在7月26日启幕的2025世界人工智能大会上，这一创新产品正式亮相，瞬间吸引了业内广泛关注，成为AI赋能千行百业的又一次跨越。当前，大模型行业正经历深刻...……更多

2025-07-28 07:27:00智能,人工智能,人工,芯片,模型,大会

NPU全球出货超1亿颗！芯原如何迎战大模型时代的边缘计算变革

...C9X00AI是AI-GPU/AI-PC，Tensor Core GPU IP CCTC-MP则面向大语言模型推理、训练。芯原NPU IP研发副总裁查凯南谈道，NPU的发展近年来大概有三个方向：首先是DEEP AI，在很多嵌入式设备里面，要把AI跟其它的处理IP做比较紧耦合的绑定，可以...……更多

2024-06-14 09:18:00变革,模型,边缘,时代,全球,模型

o1核心作者分享：激励AI自我学习，比试图教会AI每一项任务

...绍下Hyung Won Chung，从公布的o1背后人员名单来看，他属于推理研究的基础贡献者。资料显示，他是MIT博士（方向为可再生能源和能源系统），去年2月加入OpenAI担任研究科学家。加入OpenAI之前，他在Google Brain负责大语言模型的预训...……更多

2024-09-21 09:36:00教会,核心,任务,作者,学习,模型

DeepSeek这么火，为何从未拿过风投机构一分钱？

...赖算力资源的预训练阶段竞争终结了，下一阶段的重点在推理，并将出现一批新公司，DeepSeek的出现也是必然，用更低的算力资源就可以实现同等甚至更高的效能。虽然这几年大模型发展速度很快，但我们并没有投资大模型项目...……更多

2025-02-11 19:42:00投机,从未,模型,投资,投资机构,项目

位列第一梯队，腾讯混元再度领跑国内大模型

...维度的综合性测评基准，由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，真实准确地反映了国内外大模型在中...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理，在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...型，MoE模型在相同成本下效果更优，在相同规模下训练/推理成本更低，而且容量大，可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。一些应对方案包括：1）Scaling Law探索，设计基于中小模型簇的MoE Scaling ...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

阿里云CTO周靖人：全面投入升级AI大基建

...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系，让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础模型升级，...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

商汤科技发布日日新5.0大模型

...法不准确。同时，它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现，得益于其最新发布的日日新5.0版本大模型。记者了解到，自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型

广汽宣布加入DeepSeek！覆盖昊铂、传祺、埃安三大品牌

...云端生成大模型接入DeepSeek模型，实现了原生自然的深度推理体验，并基于模型新增的强推理和反思能力，主动为客户提供更多个性化服务。这种融合使得汽车从简单的指令响应工具进化为能够预见需求的伙伴，重新定义了智能...……更多

2025-02-09 14:46:00三大,品牌,模型,智能,用户,服务

腾讯：已囤很多GPU 足够训练未来几代模型

...实基础。从需求端来看，当前腾讯对GPU更大的需求集中在推理侧。随着用户推理需求的逐步增长，推理token（词元）的需求远超此前预期。此外，腾讯还计划深度整合AI与游戏业务，在游戏中以多种形式灵活部署AI。腾讯高管也坦...……更多

2025-05-14 23:45:00腾讯,模型,训练,腾讯,推理,资本

自定义Llama 3.1模型的利器来了！NVIDIA打造生成

...24日报道，NVIDIA宣布推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务，与刚推出的Meta Llama 3.1系列开源模型一起，为全球企业的生成式AI提供强力支持。Llama 3.1大语言模型有8B、70B和405B三种参数规模。模型在超过16000个NVI……更多

2024-07-25 09:30:00代工厂,代工,利器,生成,模型,服务