新时代,推理,逻辑,模型,模型,问题头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

全面开源浪潮信息发布千亿参数基础大模型“源2.0”

...51B（518亿）、2B（21亿）三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面，“源2.0”提出了新的改进方法...……更多

2023-11-28 07:46:00浪潮信息,浪潮,模型,参数,基础,信息

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...市场瞬息万变，需要实时数据处理和决策支持，大模型的推理涉及到大量的矩阵乘法计算，对硬件的矩阵乘法计算能力提出较高要求，计算复杂性可能导致响应时间延迟，不利于实时应用。加之大模型训练和推理过程需要大量的...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

火山引擎谭待：大模型的超低定价，来自对技术的信心

...大模型的超低价格引发行业震动。据悉，豆包主力模型的推理输入价格只有0.0008元/千Tokens，比行业便宜99.3%。对此，谭待坦言，“降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，火山引擎不会走这...……更多

2024-05-16 11:29:00火山,模型,定价,信心,引擎,技术

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力，使其能够自我进化在传统 LLM 中，更新模型通常需要调整所有参数，而如果目的是处理个体数据，那这种操作明显不切实际。...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

AI投资时间｜绿洲资本张津剑：相比GPT技术本身，创业者更应

...烈烈的工业革命。也许国内的大模型和OpenAI 还差很远，推理成本还太高，芯片算力有不足，但对于绝大多数AI创业者来说，当前的这一切困难都是只是噪声。当下摩尔定律仍未失效，这些问题可以留给专业人士，18个月后这些成...……更多

2024-03-01 10:56:00创业者,绿洲,资本,影响,时间,创业

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改

...05B开源巨兽Llama 3.1最近正式上线，既可用于批处理和在线推理，也可以作为基座模型，进行特定领域的专门预训练或微调。尤其是考虑到Llama 3.1有如此大的参数规模，加上丰富的15.6T token训练数据，非常适合用于数据生成。这篇...……更多

2024-07-30 09:38:00手把,英伟,最新技术,模型,代码,数据

中国首个音乐SOTA模型「天工音乐大模型」今日公测

...全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升，数学/推理/代码/文创能力提升超过30%。（天工3.0模型参数超越Grok-1，成全球最大开源MoE...……更多

2024-04-17 15:31:00天工,公测,模型,音乐,中国,天工

国产大模型真正角逐时刻：从钉钉智能客服开始谈起

...被设定了几个高频关键词，但一旦遇到稍难或者带些逻辑推理的问题时便无计可施。这是横亘在过去企业数字化最普遍同时也是最棘手的问题。一般来说，以往的智能客服的聪明程度往往取决于它背后有多少人工，你标记的关键...……更多

2023-11-21 18:29:00模型,国产,时刻,智能,模型,共创

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...型，MoE模型在相同成本下效果更优，在相同规模下训练/推理成本更低，而且容量大，可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。一些应对方案包括：1）Scaling Law探索，设计基于中小模型簇的MoE Scaling ...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

依托数据、平台、知识增强等优势夸克大模型降低问答幻觉率

...夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力。在大模型技术落地层面，夸克大模型的能力体现在四个方面，可以帮助用户提升工作、学习效率。知识能力，拥有广泛的知识覆盖、信息搜集和多语言支持等，...……更多

2023-11-23 11:11:00夸克,幻觉,模型,问答,优势,知识

GPT-4o的识图能力有多牛？四大维度深度体验

...，准确率高达100%。图片来源：GPT-4o四、手写指令和逻辑推理最后，记者上了点难度，用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美，不仅准确识别了手写体文字并遵照指示，且答题逻辑完全合...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型，也是首个支持用单台409...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑

Llama3.1根本卖不动！业内人士：开源模型成本反而更高

...闭源的商业模型会配套相应的工具链，包括训练工具链、推理工具链，这些工具链的性能要比开源的好，对于客户来说，训练就能省大概10~20%的硬件成本，推理的时候省得更多，业务规模越大，省得越多。第二层，看模型带来的...……更多

2024-08-28 09:44:00业内人士,模型,业内,根本,人士,成本

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...到，人类大脑生成和解析语言的神经网络并不负责形式化推理，而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具，而不是思考的工具，对于任何经过测试的思维形式都不是必需的」，引发了科技...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

算子开发到推理加速，一位00后开发者的“升级打怪”之旅

...框架降低了大模型训练的门槛，目前正在做大模型分布式推理加速，希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里，像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多

2024-04-27 19:00:00开发,算子,开发者,推理,之旅,升级

AI推理速度提升超10倍，Groq LPU能否取代英伟达GP

...美国人工智能初创公司Groq最新推出的面向云端大模型的推理芯片引发了业内的广泛关注。其最具特色之处在于，采用了全新的Tensor Streaming Architecture (TSA) 架构，以及拥有超高带宽的SRAM，从而使得其对于大模型的推理速度提高了1...……更多

2024-02-21 14:03:00英伟,推理,速度,加速卡,内存,芯片

清华团队提出新型光计算架构，光训练速度提升1个数量级

...了大规模智能计算的整个生命周期，开启了智能光计算的新时代。本次研究的完成，让人们看到了包括太极系列光芯片在内的智能光算力船帆的不懈航行，智能光计算平台终以解决 AI 算力所面临的问题为目标，将驶向 AI 算力的...……更多

2024-08-09 09:57:00量级,清华,架构,个数,团队,速度

Sora刷屏视频出现多处失误模拟真实世界仍需闯关

...。中科深智创始人兼CEO成维忠表示，Sora因其并非严格的推理模型，目前还存在因果关系推理问题，但这个问题不是Sora自身的问题，而是目前所有类似模型均存在的问题，类似于大模型普遍存在的幻觉问题。未来会随着训练的加...……更多

2024-02-19 09:37:00世界,视频,视频,模型,因果关系,因果

黄仁勋对话Transformer七子：我们被困在原始模型里，

...其不断交互才能变得聪明，待在实验室里并不会造福世界推理是下一个重要的进步节点，能提升数据训练效率，产生更有价值的结果对话实录部分要点整理Transformer因何横空出世？Illia Polosukhin：如果要做出能真正读取搜索结果的...……更多

2024-03-22 00:03:00架构,模型,对话,模型,数据,资源

“整活”保险业务，AI大模型哪家强？

...目前更擅长信息的检索，类似于知识图谱的能力，在逻辑推理方面还需进一步提升。“整体而言，对于营销应用和合规风控方面，由于涉及更复杂的业务规则和风险判断，大模型的能力还需要进一步提升。”朱克力基于《报告》...……更多

2023-10-10 17:56:00模型,业务,模型,报告,应用,能力

希望学素养正式发布两大核心产品丨引领素养教育新时代

...达和思维能力，全面推动孩子的综合素养提升是素养教育新时代的核心解法。希望学素养阅读表达产品负责人何昕烨据了解，希望学素养是一家专注儿童成长的内容平台，其研创团队拥有丰富的儿童教研开发能力，他们通过深入...……更多

2024-05-30 08:22:00素养,新时代,核心,教育,产品,素养

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示，在比较13.11%和13.8%时，13.11%是更大的数值。这是因为当比较两个百分数时，我们首先比较整数部分，如果它们相同，则比较小数...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

智谱AI推出第三代基座大模型可在手机上部署

...具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例，它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码，也可以成为程序员的帮手，让它帮助生成...……更多

2023-10-28 08:25:00三代,基座,可在,模型,手机,模型

第二届全球数贸会 | 文心一言成唯一入驻中国馆大模型

...代知识增强大语言模型，具备对话交互、内容创作、知识推理、多模态生成等能力。你可以跟它聊天，让它给你画一幅画，或者问它一些专业问题，写策划、做攻略，敲代码、做表格等等，高效便捷地帮助大家获取信息、知识和...……更多

2023-11-24 17:28:00中国馆,文心,中国,第二届,模型,全球

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理，上下文窗口128k，支持数十种自然语言以及80+编程语言。特别在MMLU上，其预训练版本更是达到了84.0%的准确率。消息一出，Mistral AI联创兼首席科学家第一时间转发，...……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

云天励飞发布14nm Chiplet大模型推理芯片

...理陈宁介绍，DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片，采用自主可控的国产工艺，内含国产RISC-V核，支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载SAM CV大模型、Lla...……更多

2023-11-16 18:36:00云天,推理,芯片,模型,芯片,云天