• 我的订阅
  • 头条热搜
大模型到了该「验收」的时候
...万亿级分层异构MoE结构,不仅模型效果大幅提升,其训练推理效率也提升了超过100%,并带来了50%的推理部署成本下降。而Turbo版本的混元大模型,定价仅为前一代Pro版本的一半。性能更强、价格更低,这是大模型是深入落地场景...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
...况下,用强化学习实现了性能上的跨越。此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估,测试了数学推...……更多
估值一年翻17倍,巨头创企疯狂涌入,AI搜索火爆了
...hGPT、纳米搜索(原360 AI搜索)已采用了CoT思维链的AI深度推理模式,天工AI搜索可支持多轮连续提问检索,再比如查询高考报名信息时,夸克AI搜索会一并前置官方报名入口、志愿填报建议等关联信息。 为了进一步打开AI搜索引...……更多
苹果取得技术突破:可在 iPhone 上运行大型语言模型
...为“闪存中的LLM:利用有限内存实现高效的大型语言模型推理(LLMinaflash:EfficientLargeLanguageModelInferencewithLimitedMemory)”的论文中,研究人员提出了一种巧妙的闪存利用技术,将LLM模型的数据存储在闪存中。作者指出,与传统用于……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...同的模型形态,采用混合专家模型(MoE)结构,提高训练和推理效率及专业领域适应性,具备强大的中文创作能力。 腾讯混元大模型构建三层自主可控的国产大模型全栈技术架构:上层为自研高速网络互联来支撑模型训练,预计20...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
深夜登顶,全网刷屏!来自杭州的DeepSeek震惊硅谷
...上。”不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、...……更多
消息称OpenAI计划两周内发布新AI模型“草莓” 专注于推理
...于之前的预期。根据之前的报道,“草莓”是一款专注于推理的AI产品,预计于今秋发布。但这两位测试过该模型的人士称,OpenAI计划在未来两周内发布“草莓”。当然,最终的日期也可能生变。需要指出的是,虽然“草莓”是C...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...tical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也...……更多
海南陵水黎安国际教育创新试验区图书馆引入DeepSeek-R1 开启智慧图书馆“超能力” 时代
...化。通过多模态LLM构建基础架构,接入DEEPSEEK构建其强大推理能力,并与其他功能无缝对接,拥有了超越同行的强大功能。在语言支持上,“小图图”支持中文、英文、法语等多种语言,远超多数图书馆的语言服务范畴,为国际...……更多
公孙龙:名与实的辩论高手,如何在战国时期“唇枪舌战?”
...,名词的定义和使用必须精准,模糊的概念会导致错误的推理和结论。这一思想在今天依然具有重要的现实意义。在现代社会,信息传播迅速,很多人常常因为对名词的模糊理解而产生误解。例如,“自由”这个词在不同的文化...……更多
英特尔aigc在pc上的应用
...优化,降低了模型对硬件资源的需求,进而提升了模型的推理速度,让社区开源模型能够很好地运行在个人电脑上。以大语言模型为例,英特尔通过第13代英特尔酷睿处理器XPU的加速、low-bit量化以及其它软件层面的优化,让最高...……更多
DeepSeek是真懂潍坊啊!
...eek不仅率先实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现,引发海外AI圈的广泛讨论。据报道,DeepSeek开发的模型在多项测试中的表现都优于OpenAI,且设...……更多
RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降
...智元导读】RAG通过纳入外部文档可以辅助LLM进行更复杂的推理,降低问题求解所需的推理深度,但由于文档噪声的存在,其提升效果可能会受限。中国人民大学的研究表明,尽管RAG可以提升LLM的推理能力,但这种提升作用并不是...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。“也就是说,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。”此外,李彦宏在演讲中分享了百度...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...思维链的模式,通过专家介入诱导它一步一步地进行思维推理。中国工程院院士邬贺铨(左)与度小满CEO朱光(右)交流“此外,还需要建立专门的监控系统,例如微软专门构建内容管理系统,它与语言模型协同工作,并使用特...……更多
百融云创高级副总裁陈立宇:大模型AI将在财富管理生态中产生巨大的价值
...的时候预训练成本就很高,使用过程中每问一个问题是要推理的,推理是要花钱的,还有知识库的更新,各类场景的内容生产、巡检和标注,也是一个很大的工作量。特别对于中小金融机构来讲,承担这些成本还是有压力的。第...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了自研深度思考模型混元T1正式版,这是腾讯自研的最强推理模型。腾讯表示,T1不仅吐字快、能秒回,还擅长超长文处理。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步...……更多
围绕算力+数据,矩阵起源建设开源 AI 原生软件平台
...供开箱即用的分布式算力池,为数据处理、训练、微调、推理提供快捷、稳定、高效、弹性的分布式支撑环境;面向开发者,提供完备的开发API/SDK,助力企业快速接入MatrixDC平台,实现预期的业务目标。同时,MatrixDC支持与NVIDIAA...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...电脑,二是在信息日益增加的世界,电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为,现在这波AI浪潮能为微软找到实现这两大梦想的答案。随后,Nadella聚焦Copilot。纳德拉提到了包含随时可用本地API...……更多
打造数智时代“张仲景”品牌 河南中医药大学数智中医药项目成果发布
...区别与常规大语言模型,本模型融合中医临床的“思辨”推理机制,从四诊信息推理诊断疾病病机与证候,为数智中医提供临床思辨推理能力。模型结果具有可解释性,能对诊断结果和推荐方药进行个性化辨证解释。河南中医药...……更多
WRC 2025开普勒K2大黄蜂实力吸睛,商业化进程继续加速
...分层架构的视觉-语言-动作(VLA)模型。在具身决策中,推理层凭借视觉 - 语言模型(VLM)进行深度推理与规划,执行层则基于扩散变换器(DiT)的动作模块快速生成动作指令。K2大黄蜂的\"决策 - 执行\"链路实现了毫秒级响应,...……更多
...人形象。基于大语言模型的动作合成:基于大语言模型的推理能力,实现文本驱动的数字人动作合成,合成动作更加符合文本语义与情感。基于Flow的个性化语音合成:基于Flow网格架构,仅需5—10秒音频的少样本合成个性化语音...……更多
为什么DeepSeek回答前总先“嗯”一下
...种学习成果在具体场景中尤为明显。当用户提出需要多步推理的问题时,AI语言模型生成填充词的概率会有所提升。这种模式与人类在烧脑对话中的表现完全一致——我们的大脑需要处理信息时,会不自觉地用填充词维持对话的...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
苹果展示ferret-uiai系统可理解应用程序
...指令来设计的,以便于精确引用和接地。为了增强模型的推理能力,我们进一步编制了高级任务数据集,包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V,以及其它MLLMs模型,Ferret-UIAI模型更为优...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...出手了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权...……更多
...层涟漪。3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2...……更多
更多关于科技的资讯:
从迷失到笃行:一位古贝春经销商的二十载商海沉浮与顿悟
鲁网11月27日讯(记者 赵洪斌)在鲁北商业版图上,王文俊的名字与古贝春酒业紧紧相连。然而,这段长达二十余年的合作关系
2025-11-28 08:45:00
近日,广东宇太能源与河北某工业玻璃龙头企业签约,合作利用空微子发电技术降低企业电耗。该项目由玻璃企业投资,宇太能源提供技术及设备支持
2025-11-28 08:57:00
罗振宇、张夕勇、杨慧林、罗军民四位大咖重磅推荐,杨钧博士《未来竞速》即将出版发行
百年汽车产业大变局的必读之作。近日,由国内汽车行业资深媒体人与研究观察者杨钧博士撰写的新书《竞速未来-全球新能源汽车的崛起与挑战》一书已由中国出版集团中译出版社正式出版发行
2025-11-28 09:27:00
近日,鹏华基金发布公告,旗下科创创业人工智能ETF鹏华 (认购代码:588413)于11月28日正式发行。作为首批双创人工智能ETF中的一员
2025-11-28 10:11:00
入选概率不及万分之二,阿里千问斩获顶级AI会议最佳论文
11月28日消息,人工智能领域顶级会议NeurIPS 2025公布了论文奖,阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出
2025-11-28 11:01:00
11月24日,位于启东市南阳镇的朗峰新材料启东有限公司生产车间内,自动化生产线高速运转,一条薄如蝉翼的银色金属带材从特制喷嘴中“飞”出
2025-11-28 11:05:00
济南轨道交通集团举办财务资本培训,实战专家孙春浩解析财务精英三级跃迁路径
近日,济南轨道交通集团全资子公司莱芜交通发展集团成功举办财务管理及融资业务培训。本次培训由集团财务管理部部长刘文芹主持
2025-11-28 11:09:00
锚定本土、驱动创新的金融实践!青岛银行荣膺CFV“最佳品牌竞争力城商行”奖项
11月21日,在上海举办的“2025第一财经金融价值年会”上,青岛银行凭借在科技金融、绿色金融、地方经济服务及创新能力方面的突出表现
2025-11-28 11:18:00
挂号缴费不用跑!微信医保移动支付在北京140家公立医院全面上线
近日,北京市参保市民就医迎来“智慧升级”——微信医保移动支付功能已在中国医学科学院、北京协和医院、北京大学人民医院等140家公立医院全面上线
2025-11-28 11:28:00
河北省煤田地质局物测队引入新装备提升探测能力
河北新闻网讯(吕若汐、齐彦红)11月18日,地球物理勘探设备供应商法国塞赛尔公司正式向河北省煤田地质局物测队交付了两套数字地震仪(激发系统)诺玛德65尼奥
2025-11-28 11:53:00
中新经纬11月28日电 北京市广电局网站消息,《北京市促进“人工智能+视听”产业高质量发展行动方案(2025-2029年)》(下称《行动方案》)近日发布
2025-11-28 11:57:00
均胜电子:定位“汽车+机器人Tier1”,双轮驱动进阶智能新时代
全球领先的智能汽车科技解决方案提供商均胜电子(600699.SH / 00699.HK)正以创新驱动和全球协同,在汽车电子
2025-11-28 12:15:00
严禁“带病运行”!河南就政务信息系统开发公开征求意见
大河网讯 为给非涉密政务信息系统的开发建设加上一把“安全锁”,规范全生命周期的安全管控工作,11月27日,省行政审批政务信息管理局起草了《非涉密政务信息系统开发安全管理指南(征求意见稿)》(以下简称《征求意见稿》)
2025-11-28 14:10:00
吉林机场集团门户网站二次升级 打造智慧出行服务新标杆
为持续优化用户体验、丰富服务维度,吉林省民航机场集团有限公司门户网站(https//www.jlairports.com)正式迎来二次重大升级
2025-11-28 14:41:00
商赢酱酒以文化赋能商务社交,重塑“场景思维”新体验
11月25日,一场以“商界链接创富圈层,共享‘商赢酱酒’杯中哲学,解锁中国式商务社交的‘心’语”为主题的交流会在济南成功举办
2025-11-28 14:55:00