逻辑推理,推理,逻辑,模型,语言,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

中国科技创新“乘”数直上

...中，15家厂商的模型产品已经通过备案。凭借语言理解、逻辑推理、知识问答、文本生成等通用能力，这些大语言模型产品一经推出，便受到用户的欢迎。“科技创新实现新突破。讯飞星火认知大模型处于全国领先水平。”这是...……更多

2024-02-09 06:29:00科技创新,中国,科技,数据,模型,讯飞

提质降价，国产大模型加速奔跑

...服业务特色数据资源，通过对用户意图识别、语言理解、逻辑推理、知识检索等任务的针对性、系统化训练，让“九天”客服大模型不断焕发新生机。“5G网络支撑起海量数据和大规模连接需求，让全社会的信息流动更加顺畅、...……更多

2025-02-05 03:48:00模型,国产,模型,国产,能力,成本

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...求模型给出对音频的理解，甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。简单来说，现在通义千问不仅能“看”，也能“听”了，而且更加耳聪目明。此前8月，通义千...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...1.6的智能服务可以覆盖更多元的场景、具有更强的常识和逻辑推理能力。图片来源：用户在X平台对LLaVA-1.6的试用截图在上图的应用场景中，用户发给LLaVA-1.6一张机票，询问与之相关的接机和日程安排。LLaVA-1.6不仅准确的估计了...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...力平台训练的全民开放大模型。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。百川智能发布Baichuan 3大模型，更好理解中文1月29日，百川智能发布超千亿参数的大语言...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

新一批南京大模型通过国家备案

...练的深度推理大模型，升级后的星火X1，在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果提升，在模型参数比业界同类模型小一个数量级的情况下，整体效果对标OpenAI o1和DeepSeek R1。南京发展大模型...……更多

2025-05-23 07:03:00南京,模型,国家,模型,南京,智能

理想：升级版端到端+VLM、AI推理可视化交互系统将于月底

...想汽车高速城市全场景升级端到端+VLM智驾，以及创新的AI推理可视化的交互，将在12月31日随OTA全量推送给所有的AD Max 用户。同时，理想汽车还演示了创新推理可视化的智驾显示系统。可视化智驾显示系统中热力图一样的云团，...……更多

2024-12-26 21:37:00推送,可视化,升级版,推理,将于,理想

有鹿机器人创始人兼CEO陈俊波：具身智能是中国产业革命的机遇

...用大模型都会包含这三部分，左脑就是刚刚说的语言脑，逻辑推理的能力，右脑就是空间智能，决策智能，以及小脑。今年宇树特别火热，本质上宇树真正的核心技术在小脑的部分。这是一个特别直观的介绍，上面是我们传感器...……更多

2025-06-24 15:06:00中国产业,中国,创始人,机器人,机遇,革命

文心大模型赋能千行百业，自主进化

...型3.5相比3月份的版本，效果提升50%，训练速度提升2倍，推理速度提升30倍，文心大模型3.5还新增了插件机制，扩增了大模型的能力边界。10月17日，百度世界2023大会上，李彦宏宣布文心大模型4.0正式发布。文心大模型4.0是迄今为...……更多

2023-11-19 12:55:00文心,百业,进化,模型,模型,文心

爱尔眼科入选“数字新基建”标志性项目

...型：DeepSeekR1推理模型为爱尔眼科数字人注入了更强大的逻辑推理与复杂问题处理能力，提升了数字人在交互问答中的准确性和深度。全链条医疗场景覆盖——术前教育数字人。实时交互解答患者关于青少年近视防控、屈光手术...……更多

2025-04-25 09:22:00爱尔,基建,眼科,标志性,标志,数字

听得懂、看得见、找得到！理想汽车下一代自动驾驶架构MindV

...该技术基于端到端和VLM双系统架构，通过3D空间编码器和逻辑推理生成合理的驾驶决策，并利用扩散模型优化驾驶轨迹，整个过程需在车端实时运行。 MindVLA采用3D高斯作为中间表征，利用海量数据进行自监督训练，显著提升下...……更多

2025-03-18 11:55:00下一代,架构,驾驶,理想,汽车,模型

李彦宏：开源模型将会越来越落后 | 最前线

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。其中，推理成本的大幅下降，对于大模型降低应用门槛意义最大。也就是说，客户原来如果一天调用模型1万次，现在同...……更多

2024-04-17 11:51:00李彦,越来,落后,模型,越来越,模型

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。会上，百度发布了文心大模型4.0的工具版，该工具版可以让开发者体验代码解释器功能，开发者不仅可以通过自然语言...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...力》）。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理；相反，它们试图复制在训练数据中观察到的推理步骤」。然而，事实真的是这样吗？谷歌 DeepMind 的一篇论文似乎得出了相反的结论。最近，DeepMind 今年 2 月份的...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

星火大模型v3.5发布，带来七大能力提升

...文本生成提升7.3%，语言理解提升7.6%，知识问答提升4.7%，逻辑推理提升9.5%，数学能力提升9.8%，代码能力提升8.0%，多模态能力提升6.6%。此外，星火认知大模型V3.5的语言理解、数学能力号称已经超过GPT-4Turbo，代码能力达到GPT-4Turb...……更多

2024-01-31 04:11:00星火,七大,模型,能力,星火,黑板

华为AI存储助力中国移动构建超大规模智算集群

...海量数据信息的投入。面对智算集群目前存在的可用度、推理体验等问题，华为推出业界首款AI存储——OceanStor A800，致力于成为支撑智算集群发展的关键基座。智算集群为千行万业发展新质生产力夯基筑石近年来，智能计算已...……更多

2024-12-19 18:16:00华为,集群,中国,中国移动,存储,规模

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

...佳论文奖。大型语言模型（LLM）在各种自然语言处理和推理任务中表现出卓越的能力，某些应用场景甚至超越了人类的表现。然而，这类模型在最基础的算术问题的表现上却不尽如人意。当遇到算术问题时，LLM 通常依赖记住特...……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

最新大模型产品抢先看

...绍，其中，千亿参数大模型Step-1耗时2个月训练成功，在逻辑推理、中文知识、英文知识、数学、代码方面表现出色，性能全面超越GPT-3.5，拥有优秀的长文理解和生成能力、多轮指令跟随能力以及现场学习能力，同时能够实现单...……更多

2024-06-26 00:34:00模型,产品,模型,星环,人工智能,智能

云天励飞发布14nm Chiplet大模型推理芯片

...理陈宁介绍，DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片，采用自主可控的国产工艺，内含国产RISC-V核，支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载SAM CV大模型、Lla...……更多

2023-11-16 18:36:00云天,推理,芯片,模型,芯片,云天