• 我的订阅
  • 头条热搜
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...开源模型具有巨大的潜力,SearchLVLMs在性能、可定制性和透明度上具有显著的优势。参考文献[1] Yu et al. Generate rather than retrieve: Large language models are strong context generators……更多
科大讯飞:2025打响讯飞星火大模型的5场“必赢之战”
...首发国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型X1,解决了国产算力大规模集群训练在深度思考和长思维链推理方面面临的全新挑战,用更少的算力,更小的尺寸,达到业界...……更多
中小机构弯道超车窗口来临?DeepSeek开源提供加速度
...DeepSeek的发布则证明了不一定依赖于高端GPU就能进行顶级推理,促使这类公司思考AI基建的投资逻辑和发展模式应如何调整。”王俊坦言。不过值得注意的是,通用人工智能大模型在解决数字化风控问题上面临挑战。卫浩表示,...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
IDC:中国大模型推理市场爆发,九章云极以\\\
近日,IDC发布《2025中国大模型推理算力市场分析报告》指出,大模型与生成式AI的推理算力建设已成为当前产业发展的关键环节。报告预测,2024年中国生成式AI基础设施市场规模将达到2091.9亿元。九章云极凭借在AI基础设施市场...……更多
【浪潮星锐】商广勇:关于我职业生涯关键词的三次进化
...月的艰苦努力,终于成功研发了面向工业场景的智能协同推理引擎。该引擎能够实现大模型与企业业务系统、知识库、算法模型等多知识源之间的高效协同与知识融合,显著提升大模型在复杂工业任务中的推理能力与决策效率。...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...特曼用一个简单的柱状图给出了对比:可以看到o1在数学推理和编程领域的表现要明显优于o1-preview,提升幅度在50%左右,而在科研领域的测试里,o1相对于o1-preview的表现就提升有限了。图源:OpenAI考虑到o1模型不需要额外加钱就...……更多
...息,能实时检索最新的医学文献,生成诊断建议,并通过推理过程展示,帮助医生验证诊断的可靠性。作为“侦探”,它能实时检索最新的医学文献,生成诊断建议,并通过推理过程展示,抽丝剥茧地分析疾病在孩子身上留下的...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
ChatGPT这一波更新 让我在网上不敢发照片了
...考能力。就是说,它们可以把图像整合到思维链中,作为推理的一部分。听起来咋咋呼呼的,实际如何?世超把一张 3 年前的照片发给 o3。结果它只用了 7 分钟,就分析出我是在哪个城市哪个园区甚至哪条河旁边拍摄的。。。不...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
...文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
科大讯飞:2025年1月15日首发国内首个具备深度思考和推理能力的大模型
...年科大讯飞了。最近作为股东有了危机感,请问贵公司的推理模型如何科大讯飞董秘:您好,2025年1月15日,科大讯飞首发国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型X1,解决...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
华为预测大模型首次投入钢铁实时生产控制,宝钢:将继续场景拓展
...优于目前现场使用的控制“小模型”?基于大数据分析的推理计算时延性是否能满足现场高速、实时的生产控制要求?诸如此类的问题团队此前一直在思考。团队决定率先选择控制精度要求高、生产节奏快的场景,也就是热轧自...……更多
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...于DeepSeek、Grok、OpenAl等冲击,AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能,而增加深度思考的计算能力则能让答案更精准,与一次性推理相比...……更多
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...AI高级搜索功能,具备四大亮点:·全面升级多层次分析推理能力·升级的金融投资专业AI搜索·升级的科研学术专业AI搜索·针对文档AI阅读分析的智能优化「天工AI高级搜索」不仅能提供精准的结果,更能通过多角度的专业优化,...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...」。模型升级:Baichuan4-Turbo两张4090即可部署,Baichuan4-Air推理成本下降99%接下来,如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中?从名字中不难看出,它们都是Baichuan 4系列基础模型的升级。对于企业来说,在不同场景阶段……更多
会见企业家|周鸿祎:开源才是真正难以逾越的壁垒,中美AI技术将交替领先
...力,云服务商通过算力需求激增获益,国产芯片厂商则借推理算力优化实现弯道超车,对于英伟达而言,也是好事,英伟达服务器需求随着使用算力的人数增加而增加。“很多人老是津津乐道具体技术细节,但技术并不是别人不...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。靠着CoT的强力加持,o1...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
...、智能检索的专业服务。性能方面,凭借语义理解、逻辑推理、内容生成等技术优势,夸克大模型在CMMLU权威榜单的最新评测结果中,取得优异成绩。同时,夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并行能...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...发力。一是在预训练的基础上加上强化学习,提高模型的推理能力。“强化学习还在早期,还会延续一长段时间。”第二个趋势是多模的理解生成一体化。李璟认为,文本领域已经实现生成理解任务的统一,语言模型的技术路线...……更多
...次对外亮相。此次发布的LightGPT升级版,在安全合规性、推理速度等方面均有所提升,并面向金融机构实现LightGPT-7B的开源,推理和训练全面适配华为昇腾系列产品。在重塑模式产品方面,基于LightGPT打造的四款大模型应用各有侧...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力提升超过30%。 (天工3.0模型参数超越Grok-1,成全球最大开源MoE...……更多
在山东见证智造中国新脉动|从行业首个透明工厂看见美妆山东“智”变
...设,不仅能够提升生产效率、确保产品质量、增强供应链透明度,还能为管理者科学决策提供数据支持。 2022年9月,福瑞达生物股份在行业内率先发布“透明工厂”战略,标志着化妆品行业首个“透明工厂”诞生。经过三年多...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
更多关于科技的资讯:
以时光炼技能,以热爱赴荣光:华润万家第二届“万家工匠”全国技能大赛总决赛颁奖典礼温暖落幕
聚光灯照亮领奖台,掌声致敬每一份坚守,12月8日下午,第二届“万家工匠”全国技能大赛总决赛颁奖典礼圆满落幕。历经赛场的激烈角逐与专业的层层考量
2025-12-11 10:51:00
在心理健康日益受到全社会重视的背景下,广州勤圣伊科技有限公司(以下简称“勤圣伊科技”)凭借其“科技融合专业”的创新模式
2025-12-11 11:02:00
近日,专注于心理健康领域的广州勤圣亦科技有限公司(以下简称“勤圣亦科技”)宣布,其通过“科技+专业服务”的创新模式,在心理咨询服务数字化与普惠化方面取得显著进展
2025-12-11 11:04:00
12月9日,云深处科技宣布完成超5亿元人民币C轮融资。本轮融资由招银国际和华夏基金联合领投,中国电信、中国联通旗下基金参与战略投资
2025-12-11 11:15:00
以融资租赁之力,赋能产业升级 ——2025 PA“租赁节”拉开帷幕
2025年是“十四五”规划收官之年,我国产业结构转型进入深化攻坚阶段,融资租赁作为服务实体经济、产业转型升级中的重要力量
2025-12-11 11:22:00
依靠学习 走向未来——好书推荐书单:以书为帆 智行致远
01、《电动中国》作者:杨旭东、黄郑出版社:新华出版社书中将中国新能源科技发展置于能源革命与国际竞争的双重视角下,分析动力电池
2025-12-11 12:43:00
近年来,AI驱动的修复视频清晰度软件逐渐普及,无论是老旧的VHS录像、噪点明显的夜间视频,还是压缩导致的画质损失,都有机会被修复
2025-12-11 11:06:00
二手平台价格水涨船高 便利带来隐私权限风险商报讯 今年最火的行业是什么?无疑就是AI。现在不仅仅是下载AI App
2025-12-11 11:46:00
小糖乐学以初心筑就行业标杆
2025年12月2日,2025第十一届樱桃大赏颁奖盛典在上海成功举办。盛典现场行业精英齐聚,揭晓了多个重磅奖项。其中,小糖科技集团凭借在银发健康领域的深耕实践与突出行业影响力
2025-12-11 10:21:00
iBox与京东重磅携手,德化白瓷《滴水观音》登陆京东双12
双12消费热潮将至,数字文化领域迎来重磅跨界合作—国内头部文化数字资产生态平台iBox与京东、新诤信集团深度联动,将在京东双12数藏日会场
2025-12-11 10:21:00
大浪淘沙中的掌舵者与坚守者!湖州求是教育集团董事长沈法初的“当下”与“未来”
在多数同龄人安享退休时光的年纪,65岁的湖州求是教育集团董事长沈法初,却选择站在了时代潮流的前沿,以另一种姿态继续他的教育征程——他的个人抖音账号已经吸引了56万粉丝
2025-12-11 10:21:00
鲁网12月11日讯作为国家级专精特新重点“小巨人”企业,青岛镭测创芯科技有限公司由中国海洋大学、中科院合肥物质科学研究院教授专家团队发起成立
2025-12-11 10:28:00
近日,秦皇岛经开区一家外资企业体验到了高效便捷的审批服务。该企业是一家新设外资企业,急于推进业务,因对市场登记流程不熟悉面临起步阶段的挑战
2025-12-11 10:39:00
浙江日报讯 (记者 孙良 共享联盟·绍兴 章鸿昱) 日前,作为绍兴首批获得碳足迹标识认证证书的企业之一,绍兴乾雍纺织有限公司尝到了“绿色通行证”带来的甜头
2025-12-11 09:13:00
“直播+平台+跨境”生态加速“杭州智造”货通全球杭州日报讯 近日,杭州综试区全球跨境电商产业基地在滨江阿里中心正式启动
2025-12-11 06:40:00