推理,模型,参数,模型,吞吐量,吞吐头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

中国移动山东青岛分公司持续加快推动数据算力与实体经济深度融合

...力保障，创新性引入RDMA技术，参数网络带宽达200GB，数据吞吐量达TB/s级，为大模型带来极致通信效率，最短训练时间。中国移动智算中心（青岛）依托移动云自研智算平台和国内顶尖算法调优队伍，可支撑超大规模、超高复杂...……更多

2024-05-17 19:53:00青岛,山东,中国,中国移动,实体,深度

阿里最新开源推理模型发布：性能比肩DeepSeek-R1

阿里通义发布最新开源推理模型，称其性能比肩DeepSeek-R1。3月6日凌晨，阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩De...……更多

2025-03-06 13:22:00阿里,推理,模型,性能,模型,通义

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

360智脑7b参数模型采用3.4万亿tokens训练

...AMBADA，考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中360模型在四个评测数据集上达到第一，平均分为第三。在LongBench（多任务、中英双语、针对大语言模型长文本理解能力的评测基准）测...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

挑战Scaling Law，Meta发布移动端350M小模型

...做个假设，如果把GPT-4（大约有1万亿参数）以50tokens/s的推理速度部署在生活中，你需要什么样的硬件？答案是1亿个H100 GPU。别说是移动设备了，家里都放不下。那如果降低标准，用LLaMA-v2 7B这样的模型，再加上8-bit量化呢？简单...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

...考两种模式。对于需要深入思考的复杂问题，模型会逐步推理，经过深思熟虑后给出最终答案。对于速度有要求的简单问题，模型则提供快速、近乎即时的响应，让用户实现对模型思考程度的控制。阿里通义团队认为，这两种模...……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球

专精特新下半场：AI算力驱动竞争力升级｜专精时氪直播回顾

...卡、多机互联就需要大流量的互联能力；第四，对于存储吞吐量的要求变得非常高。为了支撑上述变化，底层的基础设施也正在发生不小的改变。北京华恒盛世科技有限公司副总经理王文星指出，算力、调度和服务是AI基础设施...……更多

2023-11-30 14:50:00直播,竞争力,竞争,驱动,升级,企业

AI改变京东618：1.4万智能体上岗、1.7万数字人直播，

...，相比通用大模型，能大幅降低训练所需算力、提升推理吞吐量。基于JoyIndustrial的应用，可以实现99.3%的技术降本和32%的合规降本。长期以来，京东持续优化和创新“产品、价格、服务”，为消费者带来又好又便宜的商品、为商...……更多

2025-06-19 15:02:00京东,万智,直播,消费者,商家,数字

人工智能+ 加快赋能千行百业（经济聚焦）

...、避让、停靠等操作。 “作为智慧零碳码头，C段码头年吞吐量超200万标箱，相比同规模的传统自动化码头，集装箱倒运环节减少了50%，人员减少60%。”在数百米外的码头智控中心，天津港第二集装箱码头系统优化师范春奇向记...……更多

2025-01-07 06:03:00人工智能,百业,人工,智能,经济,智能

阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更

...开源模型系列，将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日，全球开发者大会（GDC）在上海开幕，在阿里云魔搭社区主办的论坛上，据阿里巴巴通义实验室科学家黄斐介绍，到目前为止，整个通义千问（Qwen）系列...……更多

2025-02-21 23:22:00通义,阿里,推理,实验室,模型,实验

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

春节假期济宁大安机场旅客吞吐29828人

...2024年2月17日），济宁大安机场安全保障航班229架次,旅客吞吐量29828人；旅客吞吐量同比2023年春节假期增长52.82%，完成了春节假期保障任务，为全年安全平稳运行开好局、起好步，实现了济宁民航2024年“开门红”。人气旺！加密...……更多

2024-02-19 08:52:00济宁,大安,吞吐,旅客,机场,旅客

DeepSeek“朋友圈”不断扩围：10家国内外云厂商宣布接

...eepSeek-R1。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。截至2月5日，国内外已有众多云平台宣布上线DeepSeek- R1大模...……更多

2025-02-06 07:23:00家国,接入,不断,厂商,朋友,用户

方寸之间算力无边，华硕隆重推出Ascent GX 10

...达1000AITOPS处理能力和128GB统一内存，实现无缝模型开发和推理先进架构：NVIDIA?GB10GraceBlackwell超级芯片配备BlackwellGPU、20核ArmCPU和NVLink-C2C?技术，可有效提升AI工作负载扩展互联：配置为独立或私有云系统，以在桌面上驱动AI……更多

2025-03-31 08:42:00华硕,方寸,隆重推出,之间,计算机,模型

首发！优刻得云平台上新DeepSeek-V3-0324模型

... 不仅将模型参数量由原版的671B提升至685B，编程、数学等推理思考能力大幅提升，性能表现可以与Claude3.5/3.7Sonnet相媲美。同时，模型的开源协议升级为更宽松的MIT许可，进一步降低了商业应用门槛。优刻得云平台始终密切关注A...……更多

2025-03-25 18:45:00模型,平台,模型,推理,体验,可通

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

大模型不会推理，为什么也能有思路？有人把原理搞明白了

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧

...可以大幅提升腾讯混元大模型在终端侧的运行效率，端侧推理实现首个token生成时延达到150ms，解码速率达到超过 30tokens/秒。腾讯混元大模型已为腾讯内部超过700个业务场景和C端应用提供底层技术支持，在骁龙8至尊版芯片上部...……更多

2024-10-23 02:55:00终端,模型,参数,语言,高通,终端

年少财富自由，拒绝过盖茨、马斯克、奥特曼，传奇程序员的AGI

...性，可以随上下文长度的增加线性扩展，具有5倍的推理吞吐量，基于该架构的语言模型表现超越了Transformer架构的模型。图源：Tri Dao X 账号最近，原作者带队的Mamba-2架构正式发布，在训练速度和任务执行方面都有了更大提升。...……更多

2024-07-16 16:00:00马斯,奥特,马斯克,奥特曼,盖茨,之路

AMD发布最强AI芯片，对标英伟达Blackwell，202

...能、带宽和规模提高了两倍。AMD Pensando Salina DPU 支持 400G 吞吐量，可实现快速数据传输速率，是 AI 前端网络集群中的关键组件。AMD Pensando Pollara 400 搭载了 AMD P4 可编程引擎，是业界首款支持 UEC（Ultra Ethernet……更多

2024-10-12 09:49:00英伟,芯片,性能,支持,加速器,处理

amd推出10亿参数语言模型系列amdolmo

...ens进行预训练，让模型在处理自然语言任务时具有强大的推理能力。IT之家援引新闻稿，OLMo模型采用解码器（decoder-only）架构，并通过下一个标记预测（next-tokenprediction）进行训练，这种架构在生成文本和理解上下文方面表现出...……更多

2024-11-09 00:21:00模型,参数,语言,模型,开发者,训练

AI PC处理器“此芯P1”发布；李想疑在朋友圈回应车企抵制

...求，可运行100亿参数以内的端侧大模型，运行大语言模型吞吐量可达30tokens/s以上。其他方面，“此芯P1”最高支持64GB LPDDR5 6400Mbps内存、4K 120帧显示+最多10路外接显示；接口支持4 x USB-C、PCIe 4.0、AI加速卡、2 x GMAC等。此芯科技表……更多

2024-07-31 13:46:00处理器,处理,朋友,小鹏,科技,加速卡

成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型

...现突破，于近日全国首发基于扩散架构的人形机器人高速推理模型 R-DDIRM（Denoising Diffusion Implicit Robot Model）。这是继今年 5 月推出中国首个基于扩散架构人形机器人任务生成式模型 R-DDPRM（Denoising Diffusion Proba……更多

2024-11-25 09:49:00成都,人形,机器人,推理,模型,机器

“数智”融合为图纸升维

...展的“头号工程、核心工作”。工程按照满足2030年旅客吞吐量8300万人次、货邮吞吐量100万吨，飞机起降59.5万架次的目标进行设计，机场工程总概算批复469.29亿元，占地11992.5亩。在数字、智能建造的加持下，“长安圣殿、丝路...……更多

2023-01-17 03:18:00图纸,航站楼,西安咸阳国际机场,管线,工程,隔震