• 我的订阅
  • 头条热搜
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...务器搭载 NVIDIA H20 GPU,6U8卡 NVLink,是基于全新一代 AI超融合架构平台,面向超大规模数据中心的强劲性能,极致扩展的AI服务器,最强算力密度6U空间内搭载1块 NVIDIA Hopper架构 HGX-8GPU模组,系统支持4.0Tbps网络带宽,满足万亿级参数超大模.……更多
专家模型不要专家并行!微软开源MoE新路径
...——参数要少,效果要好,所以要在左上角: GRIN作为MoE架构,总参数量约42B,推理时激活的参数为6.6B,打同级别(7B)的非MoE模型是手拿把攥,甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中,GRIN MoE表现优异,尤其是...……更多
通信效率超98%!壁仞科技实现中国首个三种异构芯片混训技术
...壁仞科技(Biren Technology)如今罕见发声,公布其在算力架构层面的最新技术进展。9月5日,钛媒体AGI独家获悉,即将在2024全球AI芯片峰会上,壁仞科技将首次公布壁仞自主原创的异构GPU协同训练方案HGCT,业界首次支持3种及以上...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
·“日日新5.0”采用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“...……更多
华为harmonyosnext重塑全新“星盾”安全架构
...升30%、连接速度提升3倍、功耗降低20%、全新星盾安全架构、HarmonyOSIntelligence鸿蒙智能、Top5000应用已有1500+完成鸿蒙化上架。今天面向开发者和先锋用户启动Beta,首批机型包括华为Mate60系列、MateX5系列、MatePadPro13.2英寸。Harm……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...Pixtral都做了哪些工作。模型结构Pixtral 12B整体为Transformer架构,在大规模交错图像和文本文档上进行了预训练,具备多轮、多图像对话的能力。多模态解码器Pixtral的大语言模型主干选择了自家的Mistral Nemo 12B,decoder-only架构。内...……更多
装备数字工程概念与实践思考
...方案或系统之系统,隐含的技术手段包括美国国防部体系架构框架(Department of Defense Architecture Framework, DoDAF)六步法以及体系结构开发方法(Architecture Development Method……更多
定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了
...发布了自家最新的GPU——RTX 5090。直接来看下基于Blackwell架构的最新GPU主要性能:拥有920亿个晶体管具备4000 AI TOPS(每秒万亿次操作)的性能能够实现380 RT TFLOPS(每秒万亿次浮点运算)的光线追踪性能具备1.8 TB/s 的内存带宽,能...……更多
2025开年 黄仁勋扔出一串王炸
...品的重要升级。与前代RTX 40系列相比,最大的不同自然是架构,此前英伟达在高性能计算卡B200上发布的Blackwell架构,这次被下放到了消费级平台RTX 50系列上。该架构带来的升级包括全新的Transformer引擎和NVLink技术,还有在改用台...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
...时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示,开源版大模型Grok-1是一个由 xAI 从头开始训练的 3140 亿个参数混合专家模型。据介绍,基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...nt 在不同并行度配置的任务中的灵活迁移。系统设计存储架构ByteCheckpoint 采用了元数据 / 张量数据分离的存储架构,实现了 Checkpoint 管理与训练框架和并行度的解耦合。 不同训练框架中的模型以及优化器的张量切片 ( Tensor Shard)...……更多
快手发布对标Sora的视频生成大模型「可灵」 已开放邀测体验
...显得轻盈能够模拟真实物理世界的特性。得益于自研模型架构及Scaling Law激发出的强大建模能力,可灵大模型为我们构建起了一个无限逼近现实的想象空间,无论是真实世界的光影反射,重力影响下的流体运动,还是与物理世界...……更多
文心大模型赋能千行百业,自主进化
...IT技术栈发生根本性改变,从芯片、操作系统和应用三层架构,转变为芯片、框架、模型、应用四层架构。深度学习框架和大模型构成了产业智能化基座,支撑各行各业的应用智能化重构。从昆仑芯片、飞桨深度学习平台、文心...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了非常强的适应性。混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用...……更多
...。Figure AI表示,之前的方法面临着一个根本性的权衡:VLM架构通用但不够快,而机器人的视觉运动策略快但不通用。Helix通过两个互补系统解决了这一问题,让两个系统经过端对端训练,可以进行通信。系统1(S1):快速反应视...……更多
新一轮ai算力调度平台的重要性
...科技的生态主要是围绕AI算力基础设施的生态共享、AI算力大模型的资源整合以及AI数据资源的生态整合。苗慧表示,青云AI算力云可以用提供很多产品,如A800裸金属服务器、虚拟化服务器、高速网络、训练集群、推理集群、镜像...……更多
摩尔线程万卡GPU集群新进展!性能可提升20倍
...库FlagGems的适配工作。利用摩尔线程自研的统一系统计算架构MUSA,双方只用了短短一个多星期,就成功完成了近60个算子的功能验证,精度符合交付标准,并实现了对Bert-large模型的全面支持。摩尔线程研发团队经过充分调研论证...……更多
DeepSeek,大消息
...arallelism Strategies。与此同时,英伟达开源了首个在Blackwell架构上优化的DeepSeek-R1,实现了推理速度提升25倍,并且每token成本降低20倍的惊人成果。这一新模型的推出,标志着英伟达在人工智能领域的又一次重大进展。开源周第三...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...题,研究团队新的基础模型OpenCity。OpenCity结合了Transformer架构和图神经网络,用以模拟交通数据中复杂的时空依赖关系。通过在大规模、异质性交通数据集上进行预训练,OpenCity能够学习丰富、具有泛化性的表征,这些表征可有...……更多
APUS李涛阐述AI战略:为中国定制AI大模型,让大模型应用与价值创造接轨
...由 AI 工程师用自然语言驱动大模型实现。 四、AI大模型架构的五层金字塔,让产业革新构想高质量落地AI大模型五层金字塔架构图展现产业发展形态大模型训练需要大量的算力、数据和场景支持,根据AI发展现状与未来趋势判断...……更多
重大突破!新一代绿色类脑智能计算系统在横琴全球首发
...产业化发展的底层核心技术问题提供了新路径,有望在助力大模型训练、脑仿真、工业计算模拟、社交网络分析、金融风控分析等智能产业应用,走出智能计算的“中国新路”。横琴工作室出品采写:南都记者 朱鹏景 赵雨琪 ……更多
...持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百亿级大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。(小标题)已创新打造系列化芯片目前,...……更多
NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?
...够去接入到大的生态系统中去。下图呈现了芯原NPU大概的架构,芯原NPU可以带浮点32去做大量通用运算,整个软件生态往上支持OpenCL等。在过去两年,Transformer已经变成一个主导的模型架构。芯原的NPU架构也专门对Transformer做了定...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
Sora为何没能诞生在中国?
...Sora的技术报告中,强调了Diffusion Transformer(基于Transformer架构的扩散模型,以下简称DiT)的重要性,这是由两种模型合成的新模型。两种模型的“合璧”是Sora得以成为爆款的关键。Diffusion(扩散模型)是一种有效的内容生成模...……更多
英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑
英伟达最强芯片B200被迫推迟三个月,传闻闹的沸沸扬扬。老黄的对策来了:阉割版芯片B200A曝光。这难道就是“产能不够,刀法来凑”?没错,根据SemiAnalysis分析,B200遇到的主要问题正是产能不足,更具体来说是台积电的新封...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...模型AFM-server,尚未公布模型参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指...……更多
戴尔科技:夯实AI时代“算力底座”,让每一分算力“物尽其用”
...夯实了AI时代的“算力底座”。在戴尔科技集团信息基础架构解决方案事业部AI企业技术架构师、全球CTO大使吴跃看来,无论是哪种AI应用,背后都离不开AI算力与AI基础架构平台的支持。基于此,戴尔科技打造了面向AI的基础架构...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...(指令微调版本,可以直接用于交互式应用)三个版本。架构SmolVLM 最大的特点在于巧妙的架构设计,借鉴了 Idefics3,使用了 SmolLM2 1.7B 作为语言主干,通过像素混洗策略将视觉信息的压缩率提高到 9 倍。训练数据集包括 Cauldron ...……更多
阿里云AI基础设施获2024世界互联网大会领先科技奖
...存储、网络、数据处理、模型训练和推理平台的全栈技术架构体系,成为国内最早自研、布局最深入的AI基础设施。目前,80%的中国科技公司、65%的专精特新“小巨人”企业和60%的A股上市公司使用阿里云的算力服务。随着人工智...……更多
更多关于科技的资讯:
浙江日报义乌12月3日电 (记者 拜喆喆 何贤君 共享联盟·义乌 吴峰宇) 3日,义乌今年第1亿个跨境电商进口订单完成打包
2025-12-04 08:41:00
中国科大新实验终结爱因斯坦与玻尔世纪之辩
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校潘建伟、陆朝阳、陈明城教授等组成的研究团队,利用光镊囚禁的量子基态单原子
2025-12-04 11:03:00
中新经纬12月4日电 “北京市场监管”微信号4日消息,为应对AI合成技术滥用风险,规范电商直播行业秩序,近日,北京市消费者协会(以下简称“北京消协”)联合京东
2025-12-04 11:06:00
用一张照片告别2025:富士胶片X-SPACE三城点亮\
2025年11月起,富士胶片影像共享空间X-SPACE于上海、南京、杭州三地先后启动年末特别企划——"影像之树"作品征集与交流活动
2025-12-04 11:49:00
《2026年中国礼品行业展望白皮书》发布“差异化”和“质价比”等关键词
2025年10月20-23日,第33届深圳礼品家居展于深圳国际会展中心举办,展会同期进行的2025中国礼业高峰论坛上,展会主办方励展华博第三次携手国际知名咨询公司凯度重磅首发《2026年中国礼品行业展望白皮书》
2025-12-04 11:55:00
中国网12月4日讯 据国家体育总局网站消息,体育总局日前印发《关于进一步推进篮球改革发展的意见》。其中提出,有序促进职业篮球开放
2025-12-04 12:16:00
长白时评评论员 刘颂寒12月1日,电视剧《家业》和制片方华策影视发文,谴责部分短剧投机取巧,擅自截取《家业》宣传物料中的创意元素“跟拍”
2025-12-04 13:48:00
近年来,智能制造产业园引导企业顺应数字化浪潮,积极落实智改数转,推动科技创新与产业创新深度融合。以南汽集团为核心的汽车产业
2025-12-04 11:20:00
储热赋能双碳 智慧引领供热 泰山集团高电压直入式电储能技术破解能源转型难题
鲁网12月4日讯在“双碳”目标深入推进、能源结构加速转型的时代背景下,电网峰谷差拉大、清洁供热需求迫切、弃风弃光资源浪费等问题成为制约绿色发展的关键瓶颈
2025-12-04 09:57:00
上海街头的数字生活指南,是城市数字品牌与公共艺术的对话
在上海,街头悄然出现的“数字城市指示牌”成为了市民与游客驻足讨论的热点。这些立体的、新颖的指示牌,是“智云上海”这个城市信息化名片的立体呈现
2025-12-04 08:17:00
摘要:随着生成式人工智能技术在各行业的广泛应用,模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性,对输出不确定性进行量化分析成为重要方向
2025-12-04 06:17:00
杭州博士后用AI让机器懂协作、更安全杭州日报讯 让机器从执行命令的“孤岛”,成为懂得协作的群体?让机器人安全走进人类生活
2025-12-04 06:38:00
12月3日从紫林醋业获悉,紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification),获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)
2025-12-04 07:31:00
中新经纬12月3日电 12月3日,豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应,称不存在任何黑客行为。具体来看
2025-12-04 07:42:00
支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖
12月1日-3日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上,首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式
2025-12-04 07:47:00