• 我的订阅
  • 头条热搜
...源。软件上,选择稳定的操作系统,部署Vllm开源大模型推理框架,驱动大模型批量、有序计算。模型选择上,经过对各大主流模型综合评估,选择硬件资源占用率合理、推理速度快、生成内容的深度和准确性符合业务要求的Qwen-...……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...可以大幅提升腾讯混元大模型在终端侧的运行效率,端侧推理实现首个token生成时延达到150ms,解码速率达到超过 30tokens/秒。腾讯混元大模型已为腾讯内部超过700个业务场景和C端应用提供底层技术支持,在骁龙8至尊版芯片上部...……更多
科大讯飞联手华为首次攻克全国产算力下推理模型训练难关
...15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文...……更多
从机械工具到数字伙伴 人工智能正进入next level
...够极大提升生产力与效率的潜力。从概念到规模商用 “下一代人工智能”如何定义?在技术迭代与市场需求升级的驱动下,推动智能体从概念验证走向规模化商用。这个被视为“下一代人工智能”的技术究竟如何定义?又将如...……更多
商汤营收恢复增长,亏损收窄至43亿元;CEO徐立回应DeepSeek影响
...长核心引擎。这得益于市场对生成式AI模型训练、微调和推理的需求爆发性增长。过去一年,大模型技术放缓成为不可争议的事实,但AI厂商们也都在谋求应用的突破,其中特别重要的就是如何降低成本。商汤提到,算法与基础...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
对话贾扬清:明年AI推理成本还会降低10倍以上,一两年内AI使用成本或低于人工
...比之前更加乐观。他认为,“成本不是核心问题,Token的推理成本可能在接下去的一年还会再降低十倍,甚至更多。公司更应该关注的是用户体验。让AI使用成本降低到人工成本以下,可能就是一两年的时间。”他表示,“核心...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降,带动模型调用量增长迅速。报告期内,“绝影”智能汽车业务的表现也极为亮眼。其业务收入达1.7亿元,同比增长100%。上半年新增交付70.5万辆车,...……更多
ai生命周期:ai训练和ai推理的完美结合
...命周期包括最重要的两个部分,一个是AI训练,一个是AI推理。其中,AI训练就是让模型识别数据模式,是数据和处理最密集的部分,需要大规模的算力。在这一阶段,往往优先使用大规模并行的GPU加速器或专用的AI加速器,有时...……更多
交通类 AI 项目预演阶段,本地化部署的一些新思路
...模型; 资源调度类:还有团队在考虑利用DeepSeek的深度推理能力,对历史流量、天气、事件等多源数据进行融合分析,开发出大模型能够动态地优化信号灯控制策略,提升路口通行效率和交通资源利用率。这其中,报告生成类...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...考两种模式。对于需要深入思考的复杂问题,模型会逐步推理,经过深思熟虑后给出最终答案。对于速度有要求的简单问题,模型则提供快速、近乎即时的响应,让用户实现对模型思考程度的控制。阿里通义团队认为,这两种模...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...:「算力这块,你可以用别的芯片,但是这些芯片用来做推理还 OK,做训练的话还要等几年的样子,英伟达还是处在一个垄断的地位。」但基于实证的对比研究却往往又会给出不一样的答案,比如在同一个演讲中,李沐还提到了...……更多
龙芯DeepSeek推理一体机发布:CPU、系统全国产 摆脱对国外技术依赖
...前,龙芯中科宣布成功发布基于DeepSeek大模型的软硬全栈推理一体机。产品实现从芯片、系统到框架的全栈国产化支持,彻底摆脱对国外技术的依赖,为政企、教育、工业等行业用户提供高性能、安全可靠、数据不出域的私有化...……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...为ARM的20%左右,AI性能得到极大提升。目前,世界主流AI推理生态主要包括英伟达的GPU推理生态和X86的CPU推理生态。K1芯片通过复用X86成熟的AI推理软件栈,把底层核心算子改用RISC-VVector和AI指令,其余部分复用CPU推理软件栈,从...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
阿里发布全球最强开源模型千问3 通义App第一时间已上线
...布的千问3开源模型包含8款不同尺寸,均为全新的“混合推理模型”,智能水平大幅提升的同时也更省算力。其中,千问3旗舰模型Qwen3-235B-A22B是一款混合专家(MoE)模型,该模型创下所有国产模型及全球开源模型的性能新高;而...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...的 agent,是关键的一步。而这篇论文就重点研究了扩展「推理期计算」(inference-time computation)这个问题。研究团队分析了扩展测试时计算的两种主要机制:(1)针对密集的、基于过程的验证器奖励模型进行搜索;(2)根据测...……更多
全球高校同台PK,齐鲁工业大学斩获一等奖!
...超算集群,运行优化国际通行基准测试HPL&HPCG、大模型推理优化、渗流数值模拟、火星大气模拟、新型材料结构计算等前沿科学与工程应用并参加答辩。RhinoLinX灵犀队其中,大模型推理优化赛题要求参赛队伍基于开源大语言模...……更多
DeepSeek大胆披露:理论利润率高达545%!
...平台开设了其官方账号,并发布了一篇名为《DeepSeek-V3/R1推理系统概览》的技术文章。在这篇文章中,DeepSeek首次向公众详细公布了其模型推理系统的优化细节,同时披露了成本利润率的关键信息。据文章介绍,DeepSeek在推算成本...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...次采取扩容等措施保证流量异常增高后的稳定,这对Kimi推理算力、成本等也构成挑战。实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单...……更多
轻量化模型架构catvton的优势在哪里
...分简洁高效:2个网络模块(VAE+UNet)899.06M总参数量<8G推理显存(输出图像1024×768)轻量化的架构来源于CatVTON对现有方法模块冗余的观察:基于Warping的方法依靠几何匹配对服装进行形变再利用试穿模块融合,结果生硬不自然;...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
... 2此次提供的90亿(9B)和270亿(27B)参数的两个版本,其推理性能和效率均优于第一代,并具有显著的安全性改进。事实上,270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争,并且提供了此前只有专有模型才能实...……更多
华为全面启动鲲鹏昇腾原生开发
...现性能同步优化。昇腾原生开发方面,华为准备以CANN和推理引擎MindIE为基础,基于一套开发体系,面向算子、模型和应用三个开发场景,激发开发者的原生创新,IT之家总结如下。面向算子开发,我们进一步开放CANN,全面升级...……更多
...展现了三大核心优势。一是全栈自主可控,从昇腾硬件、推理引擎到模型服务,实现技术链路100%国产化,保障企业数据安全与业务合规;二是灵活选型模型,支持DeepSeek-R1满血版(671B参数)至轻量化蒸馏模型的灵活部署,覆盖...……更多
图结构转文本序列,大模型直接读懂!图推理性能大涨
...和属性,如节点计数、最大度数计算和图式形状分类等图推理任务都能完成。具体如何实现?机器学习工程师Rohan Paul发帖推荐论文并做了个总结。用多种技术开发了图线性化方法:图中心性(PageRank和度)、图退化(k-core分解)...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...型的车端部署。车载端侧8B模型首包延迟在300毫秒以内,推理速度40Tokens/秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支持主流车载计算硬件,兼容多种主流操作系统,适配多个车载芯...……更多
业界首款!中国联通发布元景思维链大模型:性能比肩OpenAI
...大慢思考能力,又具备不限于数学的多学科、多场景通用推理能力,且能做到针对不同任务和难度的自适应慢思考,大幅降低资源消耗。中国联通表示,主流榜单的测评结果显示,元景思维链大模型的表现超过了目前最好的通用...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...上万的大规模语言模型(LLM),这些模型的各项能力(如推理和生成)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出...……更多
字节发布豆包1.5深度思考模型:“实拍级”图像生成
...型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中,它能够精准高效地处理复杂问题;在创意写作等通用任务方面,同样表现出色。该模型采用MoE架构,总参数为200B,激活参数是20B ,相较于业界同类...……更多
更多关于科技的资讯:
关育兵近日,抖音博主“@爱吃蛋”凭借精确到秒的煮蛋教程,8天时间涨粉356万,被称为“蛋神”“煮蛋仙人”。最初,一名抖音用户分享“爸爸做出的完美水煮蛋”
2025-12-15 11:25:00
部分热门款式甚至卖断货 雪具市场迎“冬”风 国货订单激增
商报讯 随着入冬滑雪季的开启,多家雪场已经陆续“开板”迎客,滑雪装备市场也在悄然升温。国产雪具品牌凭借高性价比、差异化的设计及国潮元素融合等优势
2025-12-15 11:36:00
能源行业最大年度演讲在青岛举办 解码能源行业发展新趋势
12月10日至12日,“进化的能源·马一峰年度演讲2026”暨第21期综合能碳培训资源链接大会在青岛举行。作为能源行业最大的年度演讲和极具影响力的生态盛会
2025-12-15 11:55:00
厦门网讯(厦门日报记者 林露虹)厦门企业海辰储能聚焦长时储能,推出三大突破性的创新解决方案,以破解新能源消纳难题,满足AIDC(人工智能数据中心)能源转型需要
2025-12-15 08:58:00
“眼”观未来“镜”显风采 厦门眼镜产业发力新赛道
连续多年举办的厦门眼镜展。(厦门日报记者 王元晖 摄)艾普光学生产线。(资料图/厦门日报记者 林铭鸿 摄)嘉宾在厦门眼镜展上体验智能眼镜
2025-12-15 08:58:00
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知当AI成为信息分发的核心枢纽,企业却陷入前所未有的传播困境
2025-12-15 09:25:00
影视AI赛道再添强援 长江电影智象未来联合实验室挂牌 打开商业化想象空间
2025年12月11日,湖北长江电影集团与智象未来在武汉正式揭牌成立“长江电影智象未来影视AI联合实验室”,双方同步签订战略合作协议
2025-12-15 09:55:00
从古典中读懂未来:一位小提琴演奏者的“琴弓革命”
在不少人眼中,王辰翔的成长轨迹几乎是古典音乐领域的“标准答案”:四岁半拿起小提琴,少年时期便师从名家;先后进入中央音乐学院附小
2025-12-15 10:25:00
山东移动阳谷分公司助力酒店实现数字化升级
鲁网12月12日讯近日,山东移动阳谷分公司为汉庭酒店西汉庄店量身打造一体化通信解决方案,全面赋能酒店数字化转型升级。通过精准对接酒店在网络带宽
2025-12-15 09:49:00
每集2分钟、一共28集,短剧《昭世录》在美国、英国、泰国等地的短视频平台上线后爆火,海外播放量近2亿。这部短剧由位于嘉兴经开区的嘉兴九州文化传媒有限公司出品
2025-12-15 07:32:00
12月11日,金华市蓝海光电技术有限公司激光雷达事业部总经理刘崇求向记者展示了一款新型机器人导航激光雷达。该雷达除了能360度平面扫描探测
2025-12-15 07:32:00
12月14日,首届全国独角兽企业大赛总决赛在宁波高新区收官。本次总决赛由工业和信息化部火炬高技术产业开发中心、中国电子学会
2025-12-15 07:32:00
12月12日下午,“2025浙江省新消费创新大赛资源对接活动”在杭州余杭未来科技城举办。活动以“潮起新消费 智汇浙未来”为主题
2025-12-15 07:32:00
“亲,这个问题难倒我了”“对不起,我理解不了您的意思”……这些出自AI客服的经典“名言”你熟悉吗?你是不是也被AI客服“逼疯”过呢?随着年终消费季的到来
2025-12-15 07:50:00
杭州故事,叩开世界的“心门”
在中国美术学院举办的“黑神话:悟空”艺术展。记者 步恩撒 摄踏上取经路,比抵达灵山更重要——黑神话:悟空。来西游神话当一回“天命人”
2025-12-15 08:03:00