下一代,推理,模型,直播,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

京东云发布八大领先智算产品，助力企业火速用上大模型

...云DeepSeek大模型一体机，通过自研的算力池化能力、智能推理加速引擎，充分融合软硬件，实现了性能的全面提升，推理速度提升50%，企业可以根据自己的需求灵活选择不同版本，开箱即用。目前，在河南鹤壁、江苏宿迁、山东...……更多

2025-02-27 14:14:00京东,模型,领先,产品,企业,京东

对标OpenAI o1！Kimi发布新一代推理模型：中考高考

...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型，采用全新强化学习和思维链推理技术，通过模拟人脑的思考和反思过程，大幅提升解决数学难题的能力。据了解，在多项数学基准能力测试中，k0-math的...……更多

2024-11-18 08:22:00推理,新一代,模型,高考,模型,基准

AI出图更快、更懂你心意，高美感文生图模型修炼了哪些技术秘籍

...等工具如何为部署模型提供支持，助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解，细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火，也带火了背后的 DiT（扩散 Transformer）...……更多

2024-08-13 09:39:00文生,出图,美感,秘籍,心意,更快

加码“AI+编程教育”！商汤科技与编程猫达成战略合作

...。人工智能时代，编程已成为未来世界的通用语言、培养下一代创新者的关键工具。作为点猫科技旗下人工智能和编程教育品牌，编程猫面向全球青少年提供覆盖全年龄段和多种编程语言的线上课程、线下学习、赛事等考等服务...……更多

2025-04-29 16:22:00商汤,编程,战略,合作,教育,科技

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。最新研究揭示：在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败——这种现象被研究...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...交视觉-语言-动作建模框架RevThink：使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术分享群」。SwiftEdit：50 倍速文本引导图像...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

openai计划推出新型人工智能模型

...TadaoNagasaki）指出，尽管GPT-3与GPT-4的性能相差不大，但是下一代模型GPTNext预计将实现质的飞跃，其性能预计将提升100倍。 ……更多

2024-10-26 20:33:00人工智能,人工,模型,智能,模型,人工智能

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R

...况下，用强化学习实现了性能上的跨越。此外，阿里还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估，测试了数学推...……更多

2025-03-06 07:42:00阿里,推理,模型,参数,全新,能力

「清昴智能」完成数千万元Pre-A+轮融资，做懂国产芯片的模

文 | 周鑫雨编辑 | 邓咏仪36氪获悉，AI推理部署解决方案厂商“清昴智能”近日完成了数千万元Pre-A+轮融资，启赋资本、达晨财智领投，老股东奇绩创坛跟投。此前，清昴智能已获得某世界500强科技巨头公司的千万元战略投资。...……更多

2024-06-03 15:23:00数千,融资,芯片,模型,国产,智能

对标o1，Kimi放出了最能打的国产模型

...历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

3天把Llama训成Mamba，性能不降，推理更快！

...Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于到底能不能其乐融融，咱就不管了，之所以有此场景...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

英伟达没有慌，黄仁勋再谈DeepSeek：“推理”的计算需求

...于DeepSeek、Grok、OpenAl等冲击，AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能，而增加深度思考的计算能力则能让答案更精准，与一次性推理相比...……更多

2025-02-27 11:55:00英伟,推理,需求,英伟,增长,推理

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

直面大模型“大成本”挑战，如何提高算力效率？

...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

中兴通讯引领算力时代：投资智能计算基础设施与大模型训练推理

...于算力领域，并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域，大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多

2023-12-04 10:08:00中兴通讯,推理,基础设施,模型,设施,训练

唯一全国产算力训练！讯飞星火深度推理模型X1正式发布：多项指

...天的新品发布会上，科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1，这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍，与通用大模型相比，X1的解题过程更接近人类的“慢思考”方式，并且...……更多

2025-01-15 10:24:00讯飞,星火,推理,深度,模型,指标

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

ChatGPT o1满血版上线！实测中它竟然败给了国产AI？

...特曼用一个简单的柱状图给出了对比：可以看到o1在数学推理和编程领域的表现要明显优于o1-preview，提升幅度在50%左右，而在科研领域的测试里，o1相对于o1-preview的表现就提升有限了。图源：OpenAI考虑到o1模型不需要额外加钱就...……更多

2024-12-11 20:12:00实测,国产,模型,推理,文心,答案

Hugging Face发布SmolVLM开源 AI 模型：

...lVLM AI 视觉语言模型（VLM），仅有 20 亿参数，用于设备端推理，凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效，并且完全开源，所有模型检查点、VLM 数据集、训练...……更多

2024-11-28 09:47:00推理,模型,参数,模型,吞吐量,吞吐

联想AI PC明年9月上市，黄仁勋苏姿丰同台宣布拓展AI合作

...各行各业的智能化转型，探讨如何设计、推动和重新定义下一代人工智能设备、基础设施、解决方案和服务，以加速为企业和消费者带来真正的人工智能驱动成果。联想Tech World 2023推出AI PC，明年9月上市，定位高端市场人工智能...……更多

2023-10-25 20:43:00合作,人工智能,智能,人工,联想集团,杨元庆

国产GPU万卡集群终于来了！摩尔线程CEO张建中：做难而正确

...换机芯片来搭建集群，后期也会考虑与合作伙伴共同研发下一代大规模交换机，持续发展卡间通信。在框架和算法层面，夸娥万卡集群支持多种自适应混合并行策略与高效显存优化，可根据应用负载选择并自动配置最优的并行...……更多

2024-07-09 09:47:00摩尔,张建中,万卡,张建,集群,线程

赋能千行百业思必驰以垂域大模型引领AI+融合新浪潮

...“小驰”的“聊天”将更加天马行空。“DeepSeek擅长逻辑推理，我们的DFM-2大模型具备跨多个专业垂直领域的综合大模型集合能力，能够学习和利用DeepSeek的逻辑推理能力，并基于在各个垂直领域的应用经验，多维度提升DFM大模型...……更多

2025-02-14 13:01:00新浪潮,新浪,百业,模型,苏州,模型

DeepSeek V3小版本大升级：推理、前端开发加强这些

...级带来的性能提升却相当显著，特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解，新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...到，人类大脑生成和解析语言的神经网络并不负责形式化推理，而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具，而不是思考的工具，对于任何经过测试的思维形式都不是必需的」，引发了科技...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿

...。Intel还采用KV Caching、PagedAttention机制和张量并行，提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速，并获得出色的大模型推理性能，包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多

2024-07-18 14:57:00三条,通义,阿里,模型,参数,通义

全球科研团队竞逐低成本AI模型研发新范式

...基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，但此类尝试意味着企业可以较低成本研发出适合自...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球