• 我的订阅
  • 头条热搜
...训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
能看风水 夸我有情趣 Kimi现在都这么野了吗
...一个道理。在模型 “ 学好数学 ” 的基础上,再将这种逻辑推理的能力应用到物理、化学,乃至于咱们日常生活的方方面面,直到最后真正理解这个世界。而很显然, Kimi 推理模型的泛化能力已经开始显现出来了。在数据见顶...……更多
国内首个!百度文心大模型X1 Turbo斩获信通院最高评级证书
...成为国内首款通过该测评的大模型。其中,文心X1 Turbo在逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。AI Day现场,百度吴甜系统性讲解了文心大模型最新版的技术创新。她介...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
算力逻辑修复!各大厂商接入DS催化港股AI基建概念 李彦宏称仍应持续投入
...极发展成本较低的自有ASIC方案,并把重心从AI训练转往AI推理,预估将逐步推升AI推理服务器占比至接近50%。未来GPU仍将支持各种AI算法发展。中信证券的研报也指出,DeepSeek通过工程化能力创新,实现了大模型训练和推理算力成...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...一代“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“...……更多
百度智能云两大基础设施再升级!打造AI时代最开放的智能基础设施
...统级能力打造企业专属AI基础设施。百舸+昆仑芯超节点:推理性能提升13倍、成本降低95%算力是AI时代的“新电力”。百度智能云通过自研昆仑芯P800芯片及百舸大规模推理加速能力,实现算力性能与成本的双重突破。本次大会...……更多
...解释:“过去,ChatGPT等大模型像文科生,不擅长理科和逻辑推理。而对人类智慧来说,最底层的智慧是逻辑,逻辑之上是数学,再上面是物理、化学等科学。”去年9月,OpenAI发布的o1推理大模型改变了“文科生”形象,它擅长...……更多
实现从“知道”到“懂得”的性能飞跃东大发布深度推理法律垂域大模型南报网讯(记者何洁通讯员毕胜)近日,东南大学法学院数字法学团队依托东南大学大数据计算中心,正式发布国内高校首个深度推理法律垂域大模型—...……更多
实现从“知道”到“懂得”的性能飞跃东大发布深度推理法律垂域大模型南报网讯(记者何洁通讯员毕胜)近日,东南大学法学院数字法学团队依托东南大学大数据计算中心,正式发布国内高校首个深度推理法律垂域大模型—...……更多
...我们需要结合快思考的‘黑盒’预测和慢思考的‘白盒’逻辑推理,打造‘灰盒’可信大模型。具体而言,通过融合科学规律、观测数据和合成数据,开发理解物理世界的垂直领域科学大模型。”作为本届大赛评委会主席,上智...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
亚马逊推出“自动推理检查”工具,对抗 AI 幻觉
...拉斯维加斯举办的 re:Invent 2024 大会上,AWS 推出了“自动推理检查”(Automated Reasoning checks)工具,该工具通过交叉引用客户提供的信息来验证模型的响应准确性。AWS 宣称,这是“第一个”也是“唯一”的针对幻觉的防护措施。...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...不足,腾讯还特别强化了模型在高质量文本创作、数学和逻辑推理等方面的能力。 文本创作能力的显著提升在文本创作领域,大多数大模型表现平平,尤其在专业写作方面,常常缺乏足够的灵活性和精准度。混元Turbo在这方面...……更多
百川智能发布baichuan3稳定语言模型
...语言处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”...……更多
香港金融科技周|度小满CEO朱光:推理大模型将深入到金融核心业务
...布了GPT-o1大模型,“思考能力”显著提升,能够进行复杂逻辑推理和问题拆解。在本次大会上,朱光也分享了度小满用推理大模型在风控场景上做的一些创新性探索。在信贷领域,推理大模型可以通过分析客户的征信报告、银行...……更多
很强也很贵!OpenAI12天12场直播收官,官宣最新推理模型o3
...,和网友猜测的一样,人工智能(AI)巨头OpenAI发布最新推理模型o3和o3-mini。前一天,OpenAI公司CEO山姆·奥特曼(Sam Altman)就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3?奥特曼表示是为了避免和英国电...……更多
...大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这...……更多
...开评测中,它的综合能力逼近当时的顶尖大模型,尤其在逻辑推理和数学题上展现出强劲性能,而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的,是它在训练方式上的简化。以往的模型在提升推理能力时,通...……更多
人工智能的真面目到底是什么?是数学、逻辑学,还是计算机科学?
...在人工智能中发挥着重要作用。早期的专家系统就是基于逻辑推理构建的。逻辑学提供了一种形式化的方法来描述和推理世界,使得计算机能够模拟人类的思维方式进行推理和决策。虽然现代的深度学习技术已经不再直接使用逻...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...一在今年5月的 OpenCampass 测试榜单中,TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中,以 86.9 分的成绩排名第一。其通用能力较 Tele……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...、多维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型...……更多
...理陈宁介绍,DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片,采用自主可控的国产工艺,内含国产RISC-V核,支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Lla...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...数。ARC-AGI由Keras之父Fran ? ois Chollet开发,主要是通过图形逻辑推理来测试模型的推理能力。以100%为最高分的ARC-AGI评估结果显示,在低计算场景中,o3得分为75.7%,而在高计算测试中,它达到了87.5%。这标志着,o3的最佳成绩超过...……更多
智谱发布电脑智能体大模型GLM-PC:回车即用 协助完成各类电脑任务
...成各类电脑任务。GLM-PC的“深度思考”模式升级,强化了逻辑推理和代码生成能力,模仿人脑的分工合作,将逻辑推理与感知认知深度结合。GLM-PC的“左脑”负责代码生成与逻辑执行,具有规划、循环执行、长思考能力(动态反...……更多
更多关于科技的资讯:
新网银行用“五篇大文章”打开数字金融的未来
三十年前的1995年,中国第一家城市商业银行在深圳落地,开启了城商行服务地方经济、服务中小企业、服务城乡居民的时代篇章
2025-12-03 21:31:00
凤冈:数字技术赋能肉牛产业 智慧养殖引领乡村振兴
多彩贵州网讯 当传统养殖业插上“数字翅膀”,会带来怎样的变革?在凤冈县,肉牛产业正经历一场从“凭经验”到“看数据”的转型
2025-12-03 21:45:00
江南时报讯 作为扎根乡土的金融机构,阜宁农商银行立足数字浪潮与产业变革机遇,以创新、革新、科技为翼,奏响转型发展的昂扬乐章
2025-12-03 22:08:00
实力圈粉!常州创意产业园区企业亮相长三角文博会
近日,第六届长三角国际文化产业博览会在上海国家会展中心圆满闭幕。常州创意产业园区企业印象乾图、有维文化科技、麦拉风受邀参展
2025-12-03 22:11:00
常州科教城瞄准具身机器人产业
当智能制造叠加信息传感、场景应用、工业互联、新材料研发……机器人在当下有了更具象、多元的定义和呈现,为产业创新升级再添亮色
2025-12-03 22:11:00
西太湖,重大项目竣工!
近日,位于常州西太湖科技产业园的威克医疗外科器械研发制造中心项目、天衍医疗扩建项目、科恩新能源智能装备生产项目相继顺利通过竣工验收
2025-12-03 22:11:00
葵花药业×淘宝闪购签署战略合作:共探“AI+超级入口”下的医药即时零售新范式
11月28日,在2025淘宝闪购“聚势共赢”医药即时电商峰会现场,葵花药业集团与淘宝闪购正式签署战略合作协议,成为淘宝闪购医药健康领域首批战略级合作伙伴之一
2025-12-03 10:11:00
解码三一重能:风电龙头的突围与出海
十月的北京,三一重能南口产业园区内,一座数十米高的风力发电机静静运转,园区内却是一派繁忙景象。作为三一集团在京重要产业集群
2025-12-03 10:11:00
摘要:本文通过对不同地区互联网企业中统计学专业毕业生薪资的对比分析,探讨薪资分布的现状及其影响因素。研究发现,一线城市和二线城市在薪资水平上存在显著差异
2025-12-03 06:16:00
“张叔叔,这银行卡的密码可不能随便告诉别人,就连短信验证码也得藏好,那可是您账户的‘第二把钥匙’”。中信银行石家庄分行网点工作人员一边为70多岁的张叔叔递上一杯水
2025-12-02 10:21:00
中国移动成功举办“AI赋能医院后勤管理新发展”论坛
2025年11月27至29日,由全国卫生产业企业管理协会医院后勤管理发展分会主办的2025年学术会议在杭州召开。中国移动受邀参加“新质生产力助力医院后勤高质量发展”主论坛
2025-12-02 11:03:00
腾讯云姚一兆:用全栈AI助力具身智能赛道加速发展
“具身智能是AI赛道中的焦点,其商业化更依赖技术平台、场景适配与生态协同。腾讯云愿意提供全栈AI服务能力,助力具身智能赛道与广大企业共同发展
2025-12-02 11:03:00
在大健康消费升级与抗衰需求爆发的今天,麦角硫因作为“线粒体级”超级抗氧化剂,已成为膳食补充剂领域的核心赛道。据天猫国际发布的《2023全球超级成分趋势白皮书》显示
2025-12-02 11:31:00
企业数字化转型不断深化,业务系统的可用性、数据安全性和架构弹性正成为企业核心竞争力的重要组成部分。云服务器作为企业 IT 基础设施的底座
2025-12-02 11:42:00
11月21日,富德生命人寿保险股份有限公司在河北石家庄举行以“全维健康守护 创造美好生活”为主题的健康险产品矩阵暨服务升级发布会
2025-12-02 12:11:00