• 我的订阅
  • 头条热搜
AI行业深度研究:乘大模型之风,AI芯片元老寒武纪再度起航
... 的 AI 服 务器收入也大幅增加。我们预计未来针对训练和推理的 AI 算力需求有 望长 时间高景气,据 IDC 及 TheNextPlatform 统计,2023 年全球 AI 服务器 市场 规模预计将超 500 亿美元,2027 年预计将超 946 亿美元。在这一场科 技盛 宴...……更多
加速替代CUDA!摩尔线程开源vLLM-MUSA 加速国产GPU AI
...科技11月5日消息,近日,摩尔线程上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的范例。摩尔线程表示,正努力围绕自主研发的统一系统架构GPU、MUSA软件...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...比,苹果已用Amazon Graviton、Inferentia等AWS芯片在机器学习推理工作负载方面实现了40%以上的效率提升,并预计在Trainium 2上预训练模型时,效率将提高50%。被亚马逊豪掷80亿美元投资的Anthropic,宣布与AWS共同构建面向机器学习训练...……更多
大模型“免费”送,厂商们图什么?
...,零一万物CEO李开复接受采访时表示:“未来整个行业的推理成本每年降低10倍是可以期待的,而且这个趋势是必然的。”未来,大模型的成本将呈阶梯状下探,但目前大模型的价格却断崖式下探,甚至部分企业免费送,降价幅...……更多
华能水电获得发明专利授权:“基于ONNX的目标检测模型库系统构建方法”
...实现跨框架的深度学习模型部署;使用ONNXRuntime得到模型推理结果,为每个模型编写独立的推理代码,将结果转化为系统所需的统一格式;根据检测结果进行可视化处理,在系统中展示检测后的图像以及相应的评价指标;模型库...……更多
英伟达推出新一代芯片,“AI+”产业有望加速发展
...ops。而将两个B200与单个Grace CPU相结合的GB200,则可以为LLM推理工作负载提供30倍的性能,同时大大提高效率。比起H100,GB200的成本和能耗降低了25倍。简单说,B200、GB200的运算能力不仅比H100强得多,还比H100降低了成本、耗能。英...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...解决模型并行、数据并行等训练难题,提升AI大模型训练推理效率。应用:探索大模型知识融合新架构。构建异构知识库,支持全文检索、知识推理等各类知识检索场景需求。深度定制全文检索框架,支持文档类知识的高性能精...……更多
摩尔线程新方法优化AI交互:显存节省最多82%
...化新范式》,使得端到端延迟低于现在主流的Flash Attention推理引擎,kv-cache显存占用节省最多82%。近年来,AI大型语言模型的进步,推动了语言模型服务在日常问题解决任务中的广泛应用。然而,长时间的交互暴露出两大显著问...……更多
...源。软件上,选择稳定的操作系统,部署Vllm开源大模型推理框架,驱动大模型批量、有序计算。模型选择上,经过对各大主流模型综合评估,选择硬件资源占用率合理、推理速度快、生成内容的深度和准确性符合业务要求的Qwen-...……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...可以大幅提升腾讯混元大模型在终端侧的运行效率,端侧推理实现首个token生成时延达到150ms,解码速率达到超过 30tokens/秒。腾讯混元大模型已为腾讯内部超过700个业务场景和C端应用提供底层技术支持,在骁龙8至尊版芯片上部...……更多
阿里云百炼上线Qwen2.5-Turbo模型,可支持100万超长上下文
... Qwen2.5-Turbo在长文本、短文本任务评测集上均表现优秀在推理速度方面,通义千问团队利用稀疏注意力机制将注意力部分的计算量压缩了约12.5倍,将处理1M tokens上下文时的首字返回时间从4.9分钟降低到68秒,实现了4.3倍的速度提...……更多
商汤营收恢复增长,亏损收窄至43亿元;CEO徐立回应DeepSeek影响
...长核心引擎。这得益于市场对生成式AI模型训练、微调和推理的需求爆发性增长。过去一年,大模型技术放缓成为不可争议的事实,但AI厂商们也都在谋求应用的突破,其中特别重要的就是如何降低成本。商汤提到,算法与基础...……更多
面壁智能的端侧大模型面壁MiniCPM正式亮相
...大的底层支撑,先是算力方面,凭借全流程高效infra10倍推理加速,能够将成本降低90%;其次在算法方面,面壁模型通过高效模型训练配置实现模型能力快速形成;数据处理方面,凭借现代化数据工厂形成从数据治理到多维评测...……更多
ai生命周期:ai训练和ai推理的完美结合
...命周期包括最重要的两个部分,一个是AI训练,一个是AI推理。其中,AI训练就是让模型识别数据模式,是数据和处理最密集的部分,需要大规模的算力。在这一阶段,往往优先使用大规模并行的GPU加速器或专用的AI加速器,有时...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
亚马逊CEO:DeepSeek降低AI推理成本,但会推动企业在技术上投入更多
...收入的问题,贾西在财报后电话会上称事实并非如此,AI推理的成本将在未来大幅下降,这将使企业更容易将其他应用程序与推理和生成式AI相结合:“你在过去几周内听到的关于DeepSeek的消息就是(这个趋势)其中的一部分。事...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...考两种模式。对于需要深入思考的复杂问题,模型会逐步推理,经过深思熟虑后给出最终答案。对于速度有要求的简单问题,模型则提供快速、近乎即时的响应,让用户实现对模型思考程度的控制。阿里通义团队认为,这两种模...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...:「算力这块,你可以用别的芯片,但是这些芯片用来做推理还 OK,做训练的话还要等几年的样子,英伟达还是处在一个垄断的地位。」但基于实证的对比研究却往往又会给出不一样的答案,比如在同一个演讲中,李沐还提到了...……更多
Oracle四季度125亿美元销售合同背后:OpenAI用上Oracle云,模型推理或是关键
...系没有变化,与OCI的合作是,基于OCI使用Azure AI平台进行推理和其他需求。”不过,这并不影响Oracle仍需构建大规模数据中心,以支撑来自OpenAI的工作负载。据Oracle董事长兼首席技术官拉里·埃里森(Larry Ellison)在业绩会上解释...……更多
龙芯DeepSeek推理一体机发布:CPU、系统全国产 摆脱对国外技术依赖
...前,龙芯中科宣布成功发布基于DeepSeek大模型的软硬全栈推理一体机。产品实现从芯片、系统到框架的全栈国产化支持,彻底摆脱对国外技术的依赖,为政企、教育、工业等行业用户提供高性能、安全可靠、数据不出域的私有化...……更多
OpenAI CEO承认了!DeepSeek非常棒 不会起诉
...了业界对于“AI算力需求”的看法。特别是DeepSeek推出的推理大模型DeepSeek-R1,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20(仅用了2048 个 H800 GPU,花了两个月的时间训练完成,仅花费了约558万美元),AP...……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...为ARM的20%左右,AI性能得到极大提升。目前,世界主流AI推理生态主要包括英伟达的GPU推理生态和X86的CPU推理生态。K1芯片通过复用X86成熟的AI推理软件栈,把底层核心算子改用RISC-VVector和AI指令,其余部分复用CPU推理软件栈,从...……更多
电脑成精了!OpenAI推出AI代理Operator 能像人类一样浏览网页
...人工智能(AGI)的五个步骤中,AI代理是继聊天机器人、推理机器人之后的第三步,也是全新的一步。山姆·奥尔特曼介绍称,从周四开始,美国的ChatGPT Pro用户(一个月交200美元)将能使用“研究预览版”的Operator。未来将拓展...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...智能计算的“潜力股”,为后摩尔时代带来新的希望。 推理和训练是 AI 大模型核心能力的两个重要阶段,正是看到了这一点,该团队在推理和训练方面进行了同期的并行研究。今年 4 月,他们在 Science 报道了通用智能光计算芯...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。然而,可能很多人并没有意识到,很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多
全球高校同台PK,齐鲁工业大学斩获一等奖!
...超算集群,运行优化国际通行基准测试HPL&HPCG、大模型推理优化、渗流数值模拟、火星大气模拟、新型材料结构计算等前沿科学与工程应用并参加答辩。RhinoLinX灵犀队其中,大模型推理优化赛题要求参赛队伍基于开源大语言模...……更多
DeepSeek大胆披露:理论利润率高达545%!
...平台开设了其官方账号,并发布了一篇名为《DeepSeek-V3/R1推理系统概览》的技术文章。在这篇文章中,DeepSeek首次向公众详细公布了其模型推理系统的优化细节,同时披露了成本利润率的关键信息。据文章介绍,DeepSeek在推算成本...……更多
轻量化模型架构catvton的优势在哪里
...分简洁高效:2个网络模块(VAE+UNet)899.06M总参数量<8G推理显存(输出图像1024×768)轻量化的架构来源于CatVTON对现有方法模块冗余的观察:基于Warping的方法依靠几何匹配对服装进行形变再利用试穿模块融合,结果生硬不自然;...……更多
为AI加速而生 英特尔第五代至强CPU带来AI新表现
...来概括它的特点,那就是——AI味道越发得浓厚。以训练、推理大模型为例:• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;• 与第三代相比,AI训练和推理性能提升高达14倍。什么概念?现在若是将不超过200亿参数的模型...……更多
更多关于科技的资讯:
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00
烟台南山学院斩获省部级科技奖荣誉
近日,2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”
2025-12-05 15:00:00
盐城盐都:“芯”智散热赋能 科创驱动前行
江南时报讯 以科创破局散热赛道,以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮,盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势
2025-12-05 15:07:00
中新建电力集团发电产业:智慧电厂新蓝图
近日,中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级,上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划
2025-12-05 15:09:00
日前,建行河北省分行2025年“人工智能+”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛,经过严格的初审选拔
2025-12-05 15:09:00
全国首台套!助力煤矸石全量高值转化
12月1日,由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运
2025-12-05 15:10:00
如何“反内卷”?54.5%职场人将“优化薪酬激励机制”列为首选
什么是“好工作”?工作有哪些特质会让员工有“好”感受?日前,智联招聘通过问卷调研的方式,对平台用户展开调研,回收3525份有效样本
2025-12-05 15:26:00
国航举办“国航+”生态主题发布会
海外网北京12月5日电(记者严冰)12月5日,中国国际航空股份有限公司(以下简称“国航”)在北京举办“云端无界 凤启耀星河——‘国航+’生态主题发布会”
2025-12-05 15:33:00
乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业!
12月5日,国内仓储式品牌特卖开创者荟品仓,在房山区瑞来广场盛大开业,带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣
2025-12-05 15:55:00
易生支付“智慧分账”赋能安心鲜生 驱动社区零售全国布局
在社区零售数字化转型加速深化的背景下,易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力
2025-12-05 16:09:00
ED用药怎么选?金钢鸟领衔西地那非口崩片品牌阵营,购买渠道全解析
第91届全国药交会上,金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相,让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点
2025-12-05 16:09:00
苏州黄埭镇推动“产学研”深度融合
江南时报讯 日前,苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作,联合启动轮式双臂机器人研发项目,致力于推动创新成果向现实生产力加速转化
2025-12-05 16:13:00
近邻碰碰:以 “邻里经济”打造智慧社区消费新生态 —— 专访小门神传媒科技集团董事长付信中
鲁网12月4日讯“远亲不如近邻”,这句家喻户晓的俗语,如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备
2025-12-05 16:47:00
今年双十一,A4纸大小的巨型吊牌成为女装电商的“标配”。这种硬材质、高存在感的“防白嫖神器”,在社交平台引发热议,同时也揭露了线上服装行业的信任危机
2025-12-05 17:00:00
龙岩联通“5G+AI+无人机”项目荣获第八届“绽放杯”5G应用征集大赛全国优秀奖
东南网龙岩12月5日讯(通讯员 曹可煊)近日,第八届“绽放杯”5G应用征集大赛全国赛圆满落幕。龙岩联通为华电连城风电打造的“智驭低空——构建‘5G+AI+无人机’绿电智能运维新范式”项目
2025-12-05 17:16:00