• 我的订阅
  • 头条热搜
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...务器搭载 NVIDIA H20 GPU,6U8卡 NVLink,是基于全新一代 AI超融合架构平台,面向超大规模数据中心的强劲性能,极致扩展的AI服务器,最强算力密度6U空间内搭载1块 NVIDIA Hopper架构 HGX-8GPU模组,系统支持4.0Tbps网络带宽,满足万亿级参数超大模.……更多
专家模型不要专家并行!微软开源MoE新路径
...——参数要少,效果要好,所以要在左上角: GRIN作为MoE架构,总参数量约42B,推理时激活的参数为6.6B,打同级别(7B)的非MoE模型是手拿把攥,甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中,GRIN MoE表现优异,尤其是...……更多
通信效率超98%!壁仞科技实现中国首个三种异构芯片混训技术
...壁仞科技(Biren Technology)如今罕见发声,公布其在算力架构层面的最新技术进展。9月5日,钛媒体AGI独家获悉,即将在2024全球AI芯片峰会上,壁仞科技将首次公布壁仞自主原创的异构GPU协同训练方案HGCT,业界首次支持3种及以上...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
·“日日新5.0”采用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...Pixtral都做了哪些工作。模型结构Pixtral 12B整体为Transformer架构,在大规模交错图像和文本文档上进行了预训练,具备多轮、多图像对话的能力。多模态解码器Pixtral的大语言模型主干选择了自家的Mistral Nemo 12B,decoder-only架构。内...……更多
华为harmonyosnext重塑全新“星盾”安全架构
...升30%、连接速度提升3倍、功耗降低20%、全新星盾安全架构、HarmonyOSIntelligence鸿蒙智能、Top5000应用已有1500+完成鸿蒙化上架。今天面向开发者和先锋用户启动Beta,首批机型包括华为Mate60系列、MateX5系列、MatePadPro13.2英寸。Harm……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
...时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示,开源版大模型Grok-1是一个由 xAI 从头开始训练的 3140 亿个参数混合专家模型。据介绍,基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...nt 在不同并行度配置的任务中的灵活迁移。系统设计存储架构ByteCheckpoint 采用了元数据 / 张量数据分离的存储架构,实现了 Checkpoint 管理与训练框架和并行度的解耦合。 不同训练框架中的模型以及优化器的张量切片 ( Tensor Shard)...……更多
快手发布对标Sora的视频生成大模型「可灵」 已开放邀测体验
...显得轻盈能够模拟真实物理世界的特性。得益于自研模型架构及Scaling Law激发出的强大建模能力,可灵大模型为我们构建起了一个无限逼近现实的想象空间,无论是真实世界的光影反射,重力影响下的流体运动,还是与物理世界...……更多
文心大模型赋能千行百业,自主进化
...IT技术栈发生根本性改变,从芯片、操作系统和应用三层架构,转变为芯片、框架、模型、应用四层架构。深度学习框架和大模型构成了产业智能化基座,支撑各行各业的应用智能化重构。从昆仑芯片、飞桨深度学习平台、文心...……更多
新一轮ai算力调度平台的重要性
...科技的生态主要是围绕AI算力基础设施的生态共享、AI算力大模型的资源整合以及AI数据资源的生态整合。苗慧表示,青云AI算力云可以用提供很多产品,如A800裸金属服务器、虚拟化服务器、高速网络、训练集群、推理集群、镜像...……更多
摩尔线程万卡GPU集群新进展!性能可提升20倍
...库FlagGems的适配工作。利用摩尔线程自研的统一系统计算架构MUSA,双方只用了短短一个多星期,就成功完成了近60个算子的功能验证,精度符合交付标准,并实现了对Bert-large模型的全面支持。摩尔线程研发团队经过充分调研论证...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...题,研究团队新的基础模型OpenCity。OpenCity结合了Transformer架构和图神经网络,用以模拟交通数据中复杂的时空依赖关系。通过在大规模、异质性交通数据集上进行预训练,OpenCity能够学习丰富、具有泛化性的表征,这些表征可有...……更多
APUS李涛阐述AI战略:为中国定制AI大模型,让大模型应用与价值创造接轨
...由 AI 工程师用自然语言驱动大模型实现。 四、AI大模型架构的五层金字塔,让产业革新构想高质量落地AI大模型五层金字塔架构图展现产业发展形态大模型训练需要大量的算力、数据和场景支持,根据AI发展现状与未来趋势判断...……更多
...持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百亿级大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。(小标题)已创新打造系列化芯片目前,...……更多
重大突破!新一代绿色类脑智能计算系统在横琴全球首发
...产业化发展的底层核心技术问题提供了新路径,有望在助力大模型训练、脑仿真、工业计算模拟、社交网络分析、金融风控分析等智能产业应用,走出智能计算的“中国新路”。横琴工作室出品采写:南都记者 朱鹏景 赵雨琪 ……更多
NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?
...够去接入到大的生态系统中去。下图呈现了芯原NPU大概的架构,芯原NPU可以带浮点32去做大量通用运算,整个软件生态往上支持OpenCL等。在过去两年,Transformer已经变成一个主导的模型架构。芯原的NPU架构也专门对Transformer做了定...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
Sora为何没能诞生在中国?
...Sora的技术报告中,强调了Diffusion Transformer(基于Transformer架构的扩散模型,以下简称DiT)的重要性,这是由两种模型合成的新模型。两种模型的“合璧”是Sora得以成为爆款的关键。Diffusion(扩散模型)是一种有效的内容生成模...……更多
英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑
英伟达最强芯片B200被迫推迟三个月,传闻闹的沸沸扬扬。老黄的对策来了:阉割版芯片B200A曝光。这难道就是“产能不够,刀法来凑”?没错,根据SemiAnalysis分析,B200遇到的主要问题正是产能不足,更具体来说是台积电的新封...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...模型AFM-server,尚未公布模型参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指...……更多
戴尔科技:夯实AI时代“算力底座”,让每一分算力“物尽其用”
...夯实了AI时代的“算力底座”。在戴尔科技集团信息基础架构解决方案事业部AI企业技术架构师、全球CTO大使吴跃看来,无论是哪种AI应用,背后都离不开AI算力与AI基础架构平台的支持。基于此,戴尔科技打造了面向AI的基础架构...……更多
阿里云AI基础设施获2024世界互联网大会领先科技奖
...存储、网络、数据处理、模型训练和推理平台的全栈技术架构体系,成为国内最早自研、布局最深入的AI基础设施。目前,80%的中国科技公司、65%的专精特新“小巨人”企业和60%的A股上市公司使用阿里云的算力服务。随着人工智...……更多
腾讯云公布多项大模型产品进展
...模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视...……更多
昇思MindSpore 2.3全新发布
...。面向长远规划,昇思MindSpore深耕根技术,持续演进,助力大模型产业落地。四项行动赋能学术与生态昇思MindSpore开源社区理事长丁诚在大会上公布了昇思赋能学术与生态的四项行动。昇思和中国人工智能学会、鹏城实验室合作...……更多
中国电信中部智算中心在中部地区属于最高等级
...冷智算集群,首次采用基于国产AI基础软硬件平台的方案架构,实现算、存、网、电、热整体设计。通过独特的嵌入式液冷单元,盲插总线架构,实现液冷到芯片,液冷到服务器,液冷到机柜,全场景PUE≤1.15,在达到业内一流绿...……更多
奥看科技携手政务一网通军团,AI赋能共创城市“智理”新范式
...、摄像头智能巡检、数字人城市推介等领域共同发力,助力大模型科技成果在更多场景落地。 (奥看科技CEO庞明,左3)奥看科技与政务一网通军团过多年生态磨合,在行业内形成了坚实的定位互补,共同聚焦城市治理“一网统...……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
...的Scaling Law数据、图文音视频多模态的基础模型以及Sora的架构。▲ Sora 架构 然而,骆继祥指出,尽管AI视频技术取得了长足的进步,当前仍处于完全生成与模拟之间的阶段,“无中生有为生成,适应规则为模拟”。文字与物体...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...数据上进行(自)监督训练,并大规模应用基于注意力的架构。在此过程中,研究者们开发出了具有令人印象深刻的认知能力的 LLM,如 OpenAI 的 GPT 系列、LLaMA 模型系列或谷歌 DeepMind 的 Chinchilla 和 Gemini。然而,目前还不清楚同...……更多
0提示词就能续写小说!彩云科技首创DCFormer架构大模型,AI秒变网文产粮神器
...沟通会上,AI技术公司彩云科技正式推出首款基于DCFormer架构开发的通用大模型“云锦天章”,旗下AI RPG平台“彩云小梦”也成为首款基于DCFormer架构开发的AI产品。与此同时,彩云科技CEO袁行远就AI大模型落地应用难、大模型未...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00