推理,性能,再次,重点,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...擎天、锋锐、元景系列AI服务器产品,为大规模数据训练和推理提供强劲性能,帮助AI用户高效构建AI基础设施和应用环境,满足AI场景下的多元算力需求,为AI新质生产力提供强劲引擎。擎天系列L20 AI服务器,4U8卡PCle擎天系列L20 AI服务...……更多

2024-04-28 14:05:00人工智能,重磅,生产力,人工,服务器,引擎

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

首发！优刻得云平台上新DeepSeek-V3-0324模型

... 不仅将模型参数量由原版的671B提升至685B，编程、数学等推理思考能力大幅提升，性能表现可以与Claude3.5/3.7Sonnet相媲美。同时，模型的开源协议升级为更宽松的MIT许可，进一步降低了商业应用门槛。优刻得云平台始终密切关注A...……更多

2025-03-25 18:45:00模型,平台,模型,推理,体验,可通

DeepSeek发布最新NSA技术论文！创始人梁文锋参与引人

...场景），扩展了大语言模型在文档分析、代码生成、复杂推理等领域的应用边界。同时，NSA通过针对现代硬件的优化设计，在提高推理速度的同时、降低预训练成本，而不会牺牲性能。它在通用基准测试、长文本任务和基于指令...……更多

2025-02-19 12:26:00文锋,技术论文,创始人,论文,技术,推理

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

DeepSeek降本秘诀曝光：2招极致压榨推理部署，算力全留

...把整个大模型市场搅得天翻地覆！首先，它以一己之力把推理模型的价格打下来，OpenAI六月更新的o3价格相比o1直接打了2折。其次，第三方平台托管的DeepSeek模型使用量疯狂增长，比刚发布时涨了将近20倍，成就了大批云计算厂商...……更多

2025-07-05 10:58:00极致,推理,秘诀,研究,模型,用户

黄仁勋首度回应DeepSeek冲击：英伟达暴跌系投资者误解

今年1月，中国人工智能初创公司DeepSeek发布的开源推理模型R1在海外引起巨大反响，并引发美股“AI宠儿”英伟达单日市值一度蒸发近6000亿美元。而近日，英伟达首席执行官黄仁勋首度对此事做出了公开回应。他称，DeepSeep-R1推...……更多

2025-02-22 12:57:00英伟,至关重要,投资者,冲击,投资,英伟

大模型上岗三甲医院，给每个医生都配个“病历质控助手”

...理、术语标准化后构建患者画像，再经由惠每医疗大模型推理计算做出提醒或预警，同时大模型还可以基于用户的反馈持续进行优化。图：惠每科技病历内涵质控方案架构最终，在界面的呈现上，惠每科技这个系统会有医生端和...……更多

2024-06-27 09:11:00三甲,三甲医院,病历,助手,模型,医生

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...次采取扩容等措施保证流量异常增高后的稳定，这对Kimi推理算力、成本等也构成挑战。实际上，长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示，很多大模型仅停留在长度和简单...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

推理性能飙升1.5倍！微软疯狂下单GB200芯片提升其AI算

...，新一代GB200服务器系统在Llama 3.1 700亿参数大模型上的AI推理性能对比H200提高了足足1.5倍。此外，微软还计划在低温数据中心部署GB200服务器，以缓解冷却系统的潜在压力。其他云服务提供商订单量则显著低于微软，如亚马逊在2...……更多

2024-10-20 11:52:00微软,推理,芯片,性能,疯狂,微软

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...类型的信息：- 仅输入和输出文本，也就是少样本学习- 推理追踪：添加中间推理步骤，可参阅思维链（COT）提示- 计划和反思追踪：添加信息，教LLM计划和反思其解决问题的策略，可参阅ReACT 选择正确的适配方法要决定上述哪...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

破解实时性与成本难题！白山云发布“大模型API”产品

...、算力成本的指数上升，更低延时、更优成本的边缘算力推理成为必需。边缘推理通过分布式算力下沉与智能调度，能够为高实时、高隐私、高性价比场景提供关键支撑，驱动AI从集中式智能迈向“云-边-端”全域协同智能。聚...……更多

2025-07-10 20:59:00白山,实时性,实时,难题,模型,成本

提质降价，国产大模型加速奔跑

...据方面实现多模态统一，持续突破人工智能感知、理解和推理世界的能力边界。这些，拓展着大模型与各行各业融合的深度和广度。“如今，芯片制造商、数据供应商、模型研发企业、应用开发商等方面协同合作正日益增强，共...……更多

2025-02-05 03:48:00模型,国产,模型,国产,能力,成本

字节、阿里云大降价之后，百度：两款主力大模型全面免费

...是百度自研的轻量级大语言模型，兼顾优异的模型效果与推理性能，适合低算力AI加速卡推理使用。ERNIE Speed则是百度的自研高性能大语言模型，通用能力优异，适合作为基座模型进行精调，能更好地处理特定场景问题，同时具...……更多

2024-05-21 17:30:00云大,阿里,字节,主力,模型,模型

支持1024帧、准确率近100％，英伟达「LongVILA」

...微调，(4) LLM 的上下文扩展，以及 (5) 长监督微调。对于推理，MM-SP 解决了 KV 缓存内存使用率的挑战，这在处理非常长的序列时会成为瓶颈。通过使用 LongVILA 增加视频帧数，实验结果表明该研究在 VideoMME 和长视频字幕任务上的...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

商汤生成式AI业务飙涨256%，成为中国大模型、智算服务市场

...劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降，带动模型调用量增长迅速。报告期内，“绝影”智能汽车业务的表现也极为亮眼。其业务收入达1.7亿元，同比增长100%。上半年新增交付70.5万辆车，...……更多

2024-09-13 13:50:00商汤,市场占有率,占有率,中国,生成,模型

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

算力概念股，集体爆发

...开AI产品的想象空间。英伟达在业绩交流会中指出，长时推理AI每任务所需的算力可能比单次推理高出100倍。上述券商表示，从DeepSeek到Manus，AI+工具在不断进化，AI+应用也会随之呈现增长态势，对于算力的需求有望持续增加。 ...……更多

2025-03-12 17:48:00概念股,集体,概念,模型,概念股,智能

DeepSeek开源周才第二天有些公司就已经坐不住了

...了。号称他们迄今为止最聪明的 Claude 3.7 Sonnet ，还是个推理模型和传统模型的 “ 混血 ” 。我估计今天那些专门做模型测评的博主，都快要忙不过来了吧。。。再加上 Grok 3 、 DeepSeek R1 、 o3 mini ，世超猜到了今年推理模型必有...……更多

2025-02-26 08:04:00二天,公司,模型,推理,阿里,通义

最强大模型训练芯片H200发布！

...味着什么？来看测试数据。在HBM3e加持下，H200让Llama-70B推理性能几乎翻倍，运行GPT3-175B也能提高60%。对AI公司来说还有一个好消息：H200与H100完全兼容，意味着将H200添加到已有系统中不需要做任何调整。最强AI芯片只能当半年除...……更多

2023-11-14 20:51:00芯片,模型,训练,英伟,内存,节点

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出S

...仅解码器LLM）作为文本编码器，以增强对提示词的理解和推理能力。尽管T2I生成模型多年来取得了显著进展，但大多数现有模型仍依赖CLIP或T5进行文本编码，这些模型往往缺乏强大的文本理解和指令跟随能力。与CLIP或T5不同，Gem...……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本

腾讯版Sora发布即开源！130亿参数，模型权重、推理代码全

...，成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face，一点没藏着。实际效果如何呢？目前该模型已上线腾讯元宝APP，用户可在AI应用中的“AI视频”板块申请试用。API同步开...……更多

2024-12-04 09:50:00腾讯,权重,推理,模型,参数,代码

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第一。在腾讯全球数字生态大会上，腾讯公司副总裁、云与智...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

AI时代CPU不老！Intel五代至强五大革新：340亿参数

...架的支持，特别是PyTorch、TensorFlow等等，在AI训练、实时推理、批量推理等方面，基于不同算法，性能提升最多可达40％，甚至可以处理340亿参数的大模型。根据Intel提供的数据，五代至强SPECInt整数计算性能提升21％，AI负载性能...……更多

2024-03-26 05:00:00革新,小意思,参数,时代,性能,芯片

云天励飞发布14nm Chiplet大模型推理芯片

...理陈宁介绍，DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片，采用自主可控的国产工艺，内含国产RISC-V核，支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载SAM CV大模型、Lla...……更多

2023-11-16 18:36:00云天,推理,芯片,模型,芯片,云天

优刻得助力智谱AI解锁智能生活

...强结合，GLM-4稳定、高效运行于云端，并具备大规模实时推理能力，成功实现了成本效益和服务质量的平衡。这一创新使得智谱大模型能够深入理解用户需求，快速作出响应，为用户提供智能化生活的便利与高效。自2022年起，优...……更多

2024-02-29 22:25:00智能,生活,模型,推理,规模,能力

中国电信天翼云完成国产算力与DeepSeek模型深度适配优化

...展现了三大核心优势。一是全栈自主可控，从昇腾硬件、推理引擎到模型服务，实现技术链路100%国产化，保障企业数据安全与业务合规；二是灵活选型模型，支持DeepSeek-R1满血版（671B参数）至轻量化蒸馏模型的灵活部署，覆盖...……更多

2025-02-07 17:21:00天翼,中国电信,适配,中国,深度,模型