范式,推理,模型,阶段,两个,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...市场瞬息万变，需要实时数据处理和决策支持，大模型的推理涉及到大量的矩阵乘法计算，对硬件的矩阵乘法计算能力提出较高要求，计算复杂性可能导致响应时间延迟，不利于实时应用。加之大模型训练和推理过程需要大量的...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

Llama3.1根本卖不动！业内人士：开源模型成本反而更高

...闭源的商业模型会配套相应的工具链，包括训练工具链、推理工具链，这些工具链的性能要比开源的好，对于客户来说，训练就能省大概10~20%的硬件成本，推理的时候省得更多，业务规模越大，省得越多。第二层，看模型带来的...……更多

2024-08-28 09:44:00业内人士,模型,业内,根本,人士,成本

大模型卷向下半场：价格战之后如何成为真正“刚需”

...化手段，可以降低大模型成本，在工程上可以通过分布式推理的形式将底层算力使用得更好；另外，在混合调度方面，可以把不同负载作为混合调度，这样的成本也大幅下降。阿里云相关人士也对澎湃新闻记者表示，能够推出低...……更多

2024-06-04 08:03:00价格战,半场,模型,价格,模型,价格战

华为、百度、阿里云等发起“大模型基础设施高质量发展行动计划”

...备极致性能、高扩展性、数据韧性、可持续发展、新数据范式以及数据编织能力的新一代 AI 存储是通往 AI 数智时代的必由之路。黄涛还称，随着大模型的规模法则（Scaling Law）不断演进，无论是在进行 CKPT 的并行保存与加载、...……更多

2024-11-13 14:10:00华为,阿里,基础设施,高质量,模型,设施

苹果发布mm1.5-ui模型

...从10亿到300亿的多种参数规模，拥有图像识别和自然语言推理能力。在新版本中，苹果公司的研发人员改进了数据混合策略，极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。参考论文可知，...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

华为全面启动鲲鹏昇腾原生开发

...现性能同步优化。昇腾原生开发方面，华为准备以CANN和推理引擎MindIE为基础，基于一套开发体系，面向算子、模型和应用三个开发场景，激发开发者的原生创新，IT之家总结如下。面向算子开发，我们进一步开放CANN，全面升级...……更多

2024-05-12 03:14:00华为,鲲鹏,开发,开发,鲲鹏,华为

硬件在人工智能基础教育中的角色: 机遇和挑战

...阶段也需要考虑硬件依赖，如何将模型部署在硬件上进行推理。整个流程充满了不确定性，使用难度较大。因此，在实际应用中，经典流程可以简化为两部分，一部分是与模型相关的（蓝色）、另一部分是可以利用到模型的...……更多

2024-06-26 14:45:00人工智能,人工,机遇,角色,硬件,智能

荣耀MagicOS 8.0发布，定义新一代人机交互

...平台级AI使能的意图识别人机交互，定义智能终端交互新范式；平台级AI全面使能之下，魔法OS 8.0在智慧互联、流畅性能、隐私安全、科技美学四大领域实现体验进化。此外，荣耀正式在Magic6系列上发布自研70亿参数（以下简称7B...……更多

2024-01-10 19:00:00荣耀,人机,新一代,荣耀,模型,魔法

算子开发到推理加速，一位00后开发者的“升级打怪”之旅

...框架降低了大模型训练的门槛，目前正在做大模型分布式推理加速，希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里，像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多

2024-04-27 19:00:00开发,算子,开发者,推理,之旅,升级

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

度小满CEO朱光：必须密切关注大模型在金融领域的发展

...供更多资料，例如银行流水记录。最近，我们尝试使用了推理大模型来处理这些上传的银行交易记录。该模型能够迅速发现并评估客户的风险状况。例如，模型可以识别出客户在过去几个月内疑似向高风险账户转账，表明其消费...……更多

2024-11-06 11:38:00模型,领域,金融,发展,模型,客户

北京智源研究院创始人张宏江：大模型背后的核心是一个新的操作系

...桌上的一堆玩具中抓出一个已经灭绝的动物，它能够经过推理和识别过程，从所认识的老虎、狮子、鸟等若干种动物中，成功地抓出已经灭绝的动物恐龙。这是过去的机器人不能做到的。过去你告诉机器人抓什么东西它能抓得到...……更多

2024-03-25 20:31:00张宏,北京,创始人,研究院,模型,背后

李彦宏：开源模型将会越来越落后 | 最前线

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。其中，推理成本的大幅下降，对于大模型降低应用门槛意义最大。也就是说，客户原来如果一天调用模型1万次，现在同...……更多

2024-04-17 11:51:00李彦,越来,落后,模型,越来越,模型

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示，在比较13.11%和13.8%时，13.11%是更大的数值。这是因为当比较两个百分数时，我们首先比较整数部分，如果它们相同，则比较小数...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...到现实的迁移，这些研究内容涵盖了最先进的方法、基本范式和全面的数据集。此外，该综述还探讨了数字空间和物理世界中具身智能体面临的挑战，强调其在动态数字和物理环境中主动交互的重要性。最后，该综述总结了具身...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

“秦岭・翱翔”流体力学大模型正式发布

...典理论和人工智能方法，构造数学物理关联特征、开展多范式一体化建模、搭建不变性可实现性多模态统一框架。同时，在模型算法设计、混合精度加速，以及数值求解耦合并行优化等方面进行了创新与验证，实现了高置信度流...……更多

2023-11-07 19:24:00秦岭,流体力学,流体,力学,翱翔,模型

智启新元年：PC成为AI落地首选终端

...了具备高性能计算能力的通用加速芯片，是大模型训练、推理的主要算力来源；云计算的发展和普及，则使软硬件充分解耦，大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源，开发进程大大加快；同时，Tra...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

国产大模型打响“价格战”

...对外服务，豆包通用模型pro-32k版、pro-128k版在企业市场的推理输入价格仅为0.0008元/千tokens、0.005元/千tokens，较行业降幅分别达99.3%、95.8%，推动大模型从“以分计价”进入到了“以厘计价”阶段，并声称已经击穿了大模型行业的...……更多

2024-05-23 02:54:00价格战,模型,国产,价格,模型,价格

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

数智化加速石油石化行业全产业链发展

...大模型来做判断，基础设施是至关重要的前置条件。二是推理平台帮助企业把大模型技术快速应用到场景中。对于一个企业来说，构建大模型的基础能力不仅是算力GPU，同时也会面临高质量数据如何寻找，如何高速进行数据标注...……更多

2024-05-17 11:40:00智化,产业链,石油,产业,发展,行业

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

黄仁勋明天登港！沈向洋3小时重磅演讲：发布多款大模型，具身智

...习能力o1。算法领域不断有人创造新算法实现突破，方法范式的转移尤其值得思考。过去几个月，国内一些公司和初创企业在o1这条道路上取得良好进展。其算法突破思路在于，此前大家关注的GPT系列主要是预训练，预测“下一...……更多

2024-11-23 09:42:00重磅,碰撞,模型,小时,激情,智能

自我纠错如何使OpenAI o1推理能力大大加强?北大MIT

...的技术，使得模型能够在最终确定回复之前，先检测自身推理的错误并纠正。在实际的执行过程中，这会用到一种名为思考标签（thinking tag）的机制。模型会在这个标签内部进行反思，直到它得到正确答案或认为自己得到了正确...……更多

2024-11-19 09:48:00推理,北大,团队,解释,能力,理论

一块GPU都没用，苹果自研大模型干翻GPT-4？

...参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读，并提到背后模型的训练采用的是累计10240颗谷歌TPU，而未提及英伟达GPU。根据论文描述，苹果自研大模型在指令遵循、文本总结方面测试...……更多

2024-07-31 09:37:00模型,苹果,模型,苹果,开发者,开发

专家模型不要专家并行！微软开源MoE新路径

...好，所以要在左上角： GRIN作为MoE架构，总参数量约42B，推理时激活的参数为6.6B，打同级别（7B）的非MoE模型是手拿把攥，甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中，GRIN MoE表现优异，尤其是在编码和数学测试中。...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

吕本富：端侧模型，AI创新的新赛道

...约每18个月时间会增长40倍。现在生成式大模型的计算和推理都在云端进行，大模型参数和使用量的成倍增长带来巨大计算推理压力，当数十亿用户都日常使用生成式AI时，云端模式显然难以支持生成式AI的规模化扩展。过大参数...……更多

2024-06-11 07:23:00赛道,模型,模型,云端,场景,应用

马斯克突然发布Grok-2！数学推理能力突出，攻克“9.9与

...上一代模型，Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面表现都有显著改进。值得一提的是，Grok-2在数学推理（MathVista）方面表现登顶测试榜首。但细心网友不难发现，即便是Grok-2，在其他方面与前沿模型GPT-4o或Claude ...……更多

2024-08-15 09:56:00马斯,马斯克,推理,难题,大小,能力

AI手机看荣耀：荣耀MagicOS 9.0发布开启手机自动

...开放服务构建的AI新生态，树立了智能体时代下AI OS的新范式。荣耀终端有限公司 CEO 赵明表示，MagicOS诞生之初，就确立了打造属于未来的操作系统，构建AI OS的定位。从 2016 年12月荣耀首发 Magic Live 智慧引擎，到 2022年1月MagicOS 7....……更多

2024-10-24 09:51:00荣耀,手机,新时代,驾驶,荣耀,智能

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估