推理,模型,思路,原理,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显下降的...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...tical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...73.56的高分，并在数理逻辑维度取得第一，体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出，数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型，聚焦多维度能力评估，包括基...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

火山引擎谭待：大模型的超低定价，来自对技术的信心

...大模型的超低价格引发行业震动。据悉，豆包主力模型的推理输入价格只有0.0008元/千Tokens，比行业便宜99.3%。对此，谭待坦言，“降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，火山引擎不会走这...……更多

2024-05-16 11:29:00火山,模型,定价,信心,引擎,技术

00后华裔小哥哈佛辍学组团挑战英伟达，史上最快AI芯片Soh

...元导读】史上最快Transformer芯片诞生了！用Sohu跑Llama 70B，推理性能已超B200十倍，超H100二十倍！刚刚，几位00后小哥从哈佛辍学后成立的公司Etached，宣布再融资1.2亿美元。有史以来最快的Transformer芯片，刚刚诞生了？去年21岁哈佛...……更多

2024-06-27 09:25:00小哥,英伟,哈佛,华裔,推理,芯片

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

豆包大模型公布价格清单支持国内最高并发标准

...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上，豆包通用模型的 TPM（每分钟Tokens）、RPM（每分钟请求数）均达到国内最高标准。以豆包主力模型 pro-32k 为例，价格比行业低99%，TPM...……更多

2024-05-21 11:57:00豆包,清单,模型,支持,标准,价格

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。会上，百度发布了文心大模型4.0的工具版，该工具版可以让开发者体验代码解释器功能，开发者不仅可以通过自然语言...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

ASC24超算大赛启动会在京举行，大模型推理等成为赛题

...在上海大学举行的总决赛。据悉，今年的赛题包括大模型推理优化、渗流数值模拟，以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了启...……更多

2024-01-07 19:35:00启动会,推理,模型,大赛,模型,上海大学

「清昴智能」完成数千万元Pre-A+轮融资，做懂国产芯片的模

文 | 周鑫雨编辑 | 邓咏仪36氪获悉，AI推理部署解决方案厂商“清昴智能”近日完成了数千万元Pre-A+轮融资，启赋资本、达晨财智领投，老股东奇绩创坛跟投。此前，清昴智能已获得某世界500强科技巨头公司的千万元战略投资。...……更多

2024-06-03 15:23:00数千,融资,芯片,模型,国产,智能

OpenAI机器人亮相，大模型有了“肉身”，英伟达微软都有投

...学习还能决策可以看到，Figure 01不管是在理解能力，还是推理反应都非常强大。团队特别强调，所有这些行为都没有经过远程操作，而是通过机器人自主学习。并且整段视频没有任何加速，也没有任何剪辑，全部一镜到底拍摄。...……更多

2024-03-14 17:17:00英伟,微软,肉身,机器人,模型,机器

智能体首达Kaggle Grandmaster,华为结构化推

...中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链、思维树和思维图谱。这些进步与工具集成一起，推动着通用 AI 智能体的发展，让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

3天把Llama训成Mamba，性能不降，推理更快！

...Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于到底能不能其乐融融，咱就不管了，之所以有此场景...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

直面大模型“大成本”挑战，如何提高算力效率？

...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

黄仁勋对话Transformer七子：我们被困在原始模型里，

...其不断交互才能变得聪明，待在实验室里并不会造福世界推理是下一个重要的进步节点，能提升数据训练效率，产生更有价值的结果对话实录部分要点整理Transformer因何横空出世？Illia Polosukhin：如果要做出能真正读取搜索结果的...……更多

2024-03-22 00:03:00架构,模型,对话,模型,数据,资源

自动化、可复现，基于大语言模型群体智能的多维评估基准

...上万的大规模语言模型（LLM），这些模型的各项能力（如推理和生成）也越来越强。因此，在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena，它通过收集用户对模型输出...……更多

2024-10-23 12:03:00多维,基准,群体,模型,自动化,评估

智启新元年：PC成为AI落地首选终端

...了具备高性能计算能力的通用加速芯片，是大模型训练、推理的主要算力来源；云计算的发展和普及，则使软硬件充分解耦，大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源，开发进程大大加快；同时，Tra...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...到，人类大脑生成和解析语言的神经网络并不负责形式化推理，而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具，而不是思考的工具，对于任何经过测试的思维形式都不是必需的」，引发了科技...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿

...。Intel还采用KV Caching、PagedAttention机制和张量并行，提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速，并获得出色的大模型推理性能，包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多

2024-07-18 14:57:00三条,通义,阿里,模型,参数,通义