• 我的订阅
  • 头条热搜
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多
百度智能云两大基础设施再升级!打造AI时代最开放的智能基础设施
...统级能力打造企业专属AI基础设施。百舸+昆仑芯超节点:推理性能提升13倍、成本降低95%算力是AI时代的“新电力”。百度智能云通过自研昆仑芯P800芯片及百舸大规模推理加速能力,实现算力性能与成本的双重突破。本次大会...……更多
巅峰对谈:迈向 AGI 时代,除了优秀的大模型,还需要什么?|WISE2023颠覆AIGC产业发展峰会
...展开了讨论,聚焦三个方面:图系统在提升大模型知识和推理能力中的价值及其技术发展难点和解决路径、当前大模型落地应用的重难点,以及创业机会。Fabarta创始人兼CEO高雪峰认为,实现未来AGI需要概率和符号推理共同作用...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「废话」,OpenAI ...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
...开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为止,整个通义千问(Qwen)系列...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...类模型低 75%。端侧友好:量化后端侧内存仅占 6 GB;端侧推理速度高达 18 tokens/s,相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理;且支持多种语言。统一高清框架,高效能力一拖三:小钢炮的传统优势 OCR 能力延...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
20多家车企接入DeepSeek:为啥没有“蔚小理华米特”
...上叫我给他们讲讲 AI 是怎么回事。由于同时具备强大的推理能力及开源模型两个特质,导致几乎所有科技公司都在研究怎样和 DeepSeek「深度融合」一下。华为、腾讯、百度、字节等互联网巨头,尽管都有各自自研的模型,但不...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
石油巨头牵手DeepSeek
...仑大模型的问答应用“行业大家”目前已新增DeepSeek深度推理能力。用户使用“行业大家”开展行业问答时,除了可以得到昆仑大模型生成的能源化工领域专业问答结果,还能自主选择切换至“深度思考”模式,体验知识推理、...……更多
ChatGPT大流行的思考-解析篇
...器人的本质区别。2. ChatGPT如何实现知识的获取、存储、推理及实时更新那究竟GPT如何有如此优秀的表现呢?我们不妨从人类学习思路入手,我们学习一般可分为获取知识-存储知识-推理知识-更新知识,而这也是GPT发展及学习的...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
o3 压台登场:OpenAI 卷动推理 AI 模型风云,迈向 AGI 新巅峰
...enAI 的 o3 系列大模型压台登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)。名称最新的 AI 模型为何跳过 o2,叫做 o3 呢?OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altman)在今天早上的直播活动,表示是为...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
国内首个通过主任医师评测的大模型,已在夸克AI搜索上线
...度越高、领先优势越明显的性能曲线,展现出在复杂医学推理任务中的突破。这揭示了在医学领域研发垂类模型的巨大潜力。夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的深度工程化路线。“我们不是在训练AI...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
DeepSeek开源周才第二天 有些公司就已经坐不住了
...了。号称他们迄今为止最聪明的 Claude 3.7 Sonnet ,还是个推理模型和传统模型的 “ 混血 ” 。我估计今天那些专门做模型测评的博主,都快要忙不过来了吧。。。再加上 Grok 3 、 DeepSeek R1 、 o3 mini ,世超猜到了今年推理模型必有...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...英伟达,老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人(近1个半小时),但一大波网友已经看完并交起了作业(开始卷了是吧!)网友:学起来!学起来! 黄仁勋:未来推理的增长将远...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型,也是首个支持用单台409...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
...法不准确。同时,它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现,得益于其最新发布的日日新5.0版本大模型。记者了解到,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正...……更多
...理陈宁介绍,DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片,采用自主可控的国产工艺,内含国产RISC-V核,支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Lla...……更多
更多关于科技的资讯:
□南京日报/紫金山新闻记者卫凌云 通讯员建萱江岛宣不需要司机和快递员,只需通过手机下单,无人物流车便可上门进行商品配送
2025-08-20 07:42:00
人在江宁,“飞”阅玄武湖
第九届未来网络发展大会探展人在江宁,“飞”阅玄武湖□南京日报/紫金山新闻记者张安琪实习生饶嘉萱选择点位玄武湖、打开无人机机箱
2025-08-20 07:42:00
京津冀共推新能源汽车、低空装备产业协同发展提高科技成果转化和产业化水平河北日报讯(记者米彦泽)8月12日,京津冀新能源和智能网联汽车
2025-08-19 08:31:00
解码“小镇冠军”丨广饶县大王镇:一纸风帆闯世界的底气
大众网记者 孙淑娟 东营报道世界造纸,中国领航;中国造纸,广饶担当。在黄河三角洲的沃土上,广饶县依托深厚的产业积淀,崛起为全国举足轻重的高端造纸产业基地
2025-08-19 08:51:00
当我们怀念“上行时期的美”,是在怀念一种向上的状态
最近,一个词在网上悄然走红 ——“经济上行的美”。当全球经济增速放缓,这个词的流行,本质上是大众借由对 “黄金年代” 的集体记忆
2025-08-19 09:03:00
马可波罗IPO上市注册:创新驱动新引擎,引领高质量发展趋势
在日新月异的今天,科技创新已成为推动各行各业发展的关键力量。陶瓷行业,这一承载着千年文明与历史沉淀的传统产业,在新时代的浪潮中
2025-08-19 09:51:00
为提升从业人员的专业素养与服务水平,中国人寿深州支公司开展销售人员培训活动,此次培训特邀公司经验丰富的业务精英与兄弟县市优秀讲师
2025-08-19 09:58:00
为深化全员对代理保险产品的认知,提升精准营销能力,加速拓展市场份额,8月8日下午,滦州农商银行召开2025年下半年代理保险业务专题培训会
2025-08-19 10:04:00
从“好内容”到“好转化”,巨量引擎小游戏迈入“精耕时代”
随着供需两端提速,以及AI的全面入局,一个小游戏崭新的增长时代正在展开。2025 ChinaJoy期间,由中国音像与数字出版协会和上海市虹口区人民政府联合主办的「2025 CIGDC 中国国际游戏开发者大会」在沪举行
2025-08-19 10:52:00
小猿学练机独家引进海尼曼FPC AI+全球顶级资源打造英语学习新范式
近日,教育科技领军品牌小猿学练机在北京举行“小猿学练机×海尼曼”战略合作发布会,宣布学习平板领域独家引进全球知名的 “海尼曼 FPC ”分级阅读体系
2025-08-19 10:52:00
WRC 2025开普勒K2大黄蜂实力吸睛,商业化进程继续加速
2025年8月8日至12日,2025世界机器人大会(WRC 2025)在北京经济技术开发区北人亦创国际会展中心举行。围绕 "让机器人更智慧
2025-08-19 10:52:00
韩国农水产食品流通公社助力姚琛“万里挑一 特别派对”
-以美食为桥深化中韩文化交流-2025年8月9日,内地人气歌手姚琛“万里挑一 特别派对”在北京市昌平区丘比特露营营地火热开唱
2025-08-19 10:52:00
近年来,伴随着出海浪潮不断升温,中国商品正加速迈入高质量、品牌化发展的新阶段。面对出海新趋势,近日,由中国(宁波)跨境电子商务综合试验区
2025-08-19 10:59:00
本报讯 (记者 解 磊)近日,记者从中国塑料加工工业协会(以下简称“中国塑协”)获悉,干法锂电池隔膜骨干生产企业负责人闭门座谈会在深圳召开
2025-08-19 11:03:00
2025第四届山东跨境电商交易会将于10月在烟台举办
在全球贸易格局深刻变革的浪潮中,跨境电商正以惊人的活力重塑国际贸易链路。据权威机构预测,2025年全球电商渗透率将突破25%
2025-08-19 11:16:00