• 我的订阅
  • 头条热搜
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...大规模算力集群来做训练。二是算法持续迭代,Transformer架构不能实现大一统,从稠密到稀疏模型,再到多模态模型的融合,多元架构持续演进并共存,面向特定领域设计的专用芯片难以适应未来算法,通用型算力才具备更强的...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...最强芯片亮相过去几年,英伟达曾在GTC上推出了基于Hopper架构的多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两...……更多
科技吉利创新吉利,吉利银河科技旗舰SUV“银河星舰”全球首发
... 北京报道4月25日,吉利汽车携自研的GEA全球智能新能源架构、银河11合1智能电驱、AI数字底盘、碳化硅混合驱动集成、天地一体化卫星科技等数十项行业最新、最热、最强的造车科技登陆2024北京国际车展,集中展示了吉利银河...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...现,从而大大降低了部署成本。 谷歌团队在重新设计的架构上构建了Gemma 2,使得这位Gemma家族的新成员既能提供卓越的性能,又具有高效的推理能力。简要概括一下,性能、成本、推理是它的突出特点:性能卓越:Gemma 2 27B模...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...有助于确定哪些知识可以存储为显式记忆,以及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...构建AIAgent来搭建自己的应用?在大模型时代,企业业务架构是否要进行智能化转型,架构应该如何部署和演进?在即将于6月21—22日在北京召开的WOT全球技术创新大会上,我们邀请数十位已经在大模型应用上起跑并领先半个身位...……更多
被质疑、抄袭、魔改,非主流大模型的诞生之路
...虎嗅注:RWKV创始人彭博是今天故事的主人公,在Transformer架构大行其道的当下,他一个人花了三年时间构建了RWKV架构,一种不同于Transformer架构的RNN架构。本文为虎嗅 《AI星火》系列 第 07篇稿件,《AI星火》系列聚焦AI细分行业...……更多
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...务器搭载 NVIDIA H20 GPU,6U8卡 NVLink,是基于全新一代 AI超融合架构平台,面向超大规模数据中心的强劲性能,极致扩展的AI服务器,最强算力密度6U空间内搭载1块 NVIDIA Hopper架构 HGX-8GPU模组,系统支持4.0Tbps网络带宽,满足万亿级参数超大模.……更多
专家模型不要专家并行!微软开源MoE新路径
...——参数要少,效果要好,所以要在左上角: GRIN作为MoE架构,总参数量约42B,推理时激活的参数为6.6B,打同级别(7B)的非MoE模型是手拿把攥,甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中,GRIN MoE表现优异,尤其是...……更多
通信效率超98%!壁仞科技实现中国首个三种异构芯片混训技术
...壁仞科技(Biren Technology)如今罕见发声,公布其在算力架构层面的最新技术进展。9月5日,钛媒体AGI独家获悉,即将在2024全球AI芯片峰会上,壁仞科技将首次公布壁仞自主原创的异构GPU协同训练方案HGCT,业界首次支持3种及以上...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
·“日日新5.0”采用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...Pixtral都做了哪些工作。模型结构Pixtral 12B整体为Transformer架构,在大规模交错图像和文本文档上进行了预训练,具备多轮、多图像对话的能力。多模态解码器Pixtral的大语言模型主干选择了自家的Mistral Nemo 12B,decoder-only架构。内...……更多
华为harmonyosnext重塑全新“星盾”安全架构
...升30%、连接速度提升3倍、功耗降低20%、全新星盾安全架构、HarmonyOSIntelligence鸿蒙智能、Top5000应用已有1500+完成鸿蒙化上架。今天面向开发者和先锋用户启动Beta,首批机型包括华为Mate60系列、MateX5系列、MatePadPro13.2英寸。Harm……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
...时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示,开源版大模型Grok-1是一个由 xAI 从头开始训练的 3140 亿个参数混合专家模型。据介绍,基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...nt 在不同并行度配置的任务中的灵活迁移。系统设计存储架构ByteCheckpoint 采用了元数据 / 张量数据分离的存储架构,实现了 Checkpoint 管理与训练框架和并行度的解耦合。 不同训练框架中的模型以及优化器的张量切片 ( Tensor Shard)...……更多
快手发布对标Sora的视频生成大模型「可灵」 已开放邀测体验
...显得轻盈能够模拟真实物理世界的特性。得益于自研模型架构及Scaling Law激发出的强大建模能力,可灵大模型为我们构建起了一个无限逼近现实的想象空间,无论是真实世界的光影反射,重力影响下的流体运动,还是与物理世界...……更多
文心大模型赋能千行百业,自主进化
...IT技术栈发生根本性改变,从芯片、操作系统和应用三层架构,转变为芯片、框架、模型、应用四层架构。深度学习框架和大模型构成了产业智能化基座,支撑各行各业的应用智能化重构。从昆仑芯片、飞桨深度学习平台、文心...……更多
新一轮ai算力调度平台的重要性
...科技的生态主要是围绕AI算力基础设施的生态共享、AI算力大模型的资源整合以及AI数据资源的生态整合。苗慧表示,青云AI算力云可以用提供很多产品,如A800裸金属服务器、虚拟化服务器、高速网络、训练集群、推理集群、镜像...……更多
摩尔线程万卡GPU集群新进展!性能可提升20倍
...库FlagGems的适配工作。利用摩尔线程自研的统一系统计算架构MUSA,双方只用了短短一个多星期,就成功完成了近60个算子的功能验证,精度符合交付标准,并实现了对Bert-large模型的全面支持。摩尔线程研发团队经过充分调研论证...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...题,研究团队新的基础模型OpenCity。OpenCity结合了Transformer架构和图神经网络,用以模拟交通数据中复杂的时空依赖关系。通过在大规模、异质性交通数据集上进行预训练,OpenCity能够学习丰富、具有泛化性的表征,这些表征可有...……更多
APUS李涛阐述AI战略:为中国定制AI大模型,让大模型应用与价值创造接轨
...由 AI 工程师用自然语言驱动大模型实现。 四、AI大模型架构的五层金字塔,让产业革新构想高质量落地AI大模型五层金字塔架构图展现产业发展形态大模型训练需要大量的算力、数据和场景支持,根据AI发展现状与未来趋势判断...……更多
...持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百亿级大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。(小标题)已创新打造系列化芯片目前,...……更多
重大突破!新一代绿色类脑智能计算系统在横琴全球首发
...产业化发展的底层核心技术问题提供了新路径,有望在助力大模型训练、脑仿真、工业计算模拟、社交网络分析、金融风控分析等智能产业应用,走出智能计算的“中国新路”。横琴工作室出品采写:南都记者 朱鹏景 赵雨琪 ……更多
NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?
...够去接入到大的生态系统中去。下图呈现了芯原NPU大概的架构,芯原NPU可以带浮点32去做大量通用运算,整个软件生态往上支持OpenCL等。在过去两年,Transformer已经变成一个主导的模型架构。芯原的NPU架构也专门对Transformer做了定...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
Sora为何没能诞生在中国?
...Sora的技术报告中,强调了Diffusion Transformer(基于Transformer架构的扩散模型,以下简称DiT)的重要性,这是由两种模型合成的新模型。两种模型的“合璧”是Sora得以成为爆款的关键。Diffusion(扩散模型)是一种有效的内容生成模...……更多
英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑
英伟达最强芯片B200被迫推迟三个月,传闻闹的沸沸扬扬。老黄的对策来了:阉割版芯片B200A曝光。这难道就是“产能不够,刀法来凑”?没错,根据SemiAnalysis分析,B200遇到的主要问题正是产能不足,更具体来说是台积电的新封...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...模型AFM-server,尚未公布模型参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指...……更多
戴尔科技:夯实AI时代“算力底座”,让每一分算力“物尽其用”
...夯实了AI时代的“算力底座”。在戴尔科技集团信息基础架构解决方案事业部AI企业技术架构师、全球CTO大使吴跃看来,无论是哪种AI应用,背后都离不开AI算力与AI基础架构平台的支持。基于此,戴尔科技打造了面向AI的基础架构...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...(指令微调版本,可以直接用于交互式应用)三个版本。架构SmolVLM 最大的特点在于巧妙的架构设计,借鉴了 Idefics3,使用了 SmolLM2 1.7B 作为语言主干,通过像素混洗策略将视觉信息的压缩率提高到 9 倍。训练数据集包括 Cauldron ...……更多
更多关于科技的资讯:
在制造业提质增效的浪潮中,那些藏在生产环节里的“细枝末节”,往往藏着撬动效益升级的关键密码。近日,太重包储分公司的散件箱优化项目传来捷报
2025-09-24 07:52:00
被3000亿资金哄抢的创新药企,上市首日暴涨110%
文|胡香赟编辑|海若镜港股迎来今年第11家上市的创新药公司。9月19日,劲方医药在港交所挂牌,首日涨幅接近110%、市值逼近150亿
2025-09-24 06:26:00
2025北京文化论坛“虚实无界:视听产业融合破圈”平行论坛举办
中国青年报客户端北京9月23日电(中青报·中青网记者 沈杰群)今天,2025北京文化论坛平行论坛——“虚实无界:视听产业融合破圈”在北京国际饭店会议中心举行
2025-09-24 00:03:00
中信银行南京分行成功举办“小天元”企业生态服务平台江苏区域发布会
9月22日下午,在百余家江苏企业代表的共同见证下,中信银行“小天元”企业生态服务平台江苏区域发布会暨“进万企 信服惠企”系列活动在南京成功举办
2025-09-23 23:15:00
聚焦京津冀协同发展|一个平台,推动黄骅模具迈向高端
北京市科学技术委员会牵头,京冀相关单位共建智能模具科技成果转化中试平台一个平台,推动黄骅模具迈向高端9月11日,智能模具科技成果转化中试平台工作人员正在操作四轴机床进行生产
2025-09-23 08:49:00
AI赋能千行百业一线故事(十二):数智化转型,让电厂越来越智慧
数智化转型,让电厂越来越智慧——AI赋能千行百业一线故事(十二)8月28日,石家庄良村热电有限公司生产技术部专业主管苏朝宏介绍智慧展厅
2025-09-23 08:53:00
“产业炬光灯”系列短视频首期聚焦中材航特
“产业炬光灯”系列短视频于厦门日报官方视频号、抖音号、快手号、B站账号、央视频账号等全媒体平台同步上线,首期节目走进中材航特
2025-09-23 08:58:00
厦门网讯(厦门日报记者 林雯)旧低效工业用地加速变身科创高地。近日,随着位于思明区前埔片区的2025P13、2025P14地块成功出让
2025-09-23 08:58:00
国网厦门供电公司持续推进“EASIER用电”品牌建设
国网厦门供电公司为厦门天马微电子有限公司创造更优质、更稳定的用电环境。(国网厦门供电公司 供图)“EASIER用电”品牌厦门网讯(厦门日报记者 刘艳 通讯员 林艳婷 高芳 郭芷祎)近年来
2025-09-23 08:58:00
山东移动泰安分公司数智融合加速 赋能企业蝶变升级
鲁网9月22日讯数字化浪潮正在席卷千行百业,山东移动泰安分公司(简称:泰安移动)以“技术赋能、生态协同、梯次服务”为核心
2025-09-23 10:01:00
企鹅网络(Q学友)与腾讯云达成战略合作,携手共创“AI+职业教培”新范式
9月16日-17日,2025腾讯全球数字生态大会在深圳举办。大会期间,深圳市企鹅网络科技有限公司(以下简称“企鹅网络”)与腾讯云正式签署战略合作协议
2025-09-23 10:39:00
本报记者 赵 曦 □ 花沁昕“白天的时间都用于工作和社交,只有夜晚的时间才真正属于自己,我舍不得睡,但真想睡的时候又睡不着了
2025-09-23 10:48:00
科学为基,爱心为桥:儿童营养品牌inne携手德甲冠军俱乐部启动全球公益计划
在全民健康意识提高与消费升级的双重驱动下,新一代父母对儿童营养的重视程度前所未有。消费需求愈发细分、专业,推动儿童营养品行业从“标准化供给”向“专业化服务”转变
2025-09-23 11:20:00
《金刚狼》《权游》供应商分拆机器人数据业务,腾讯、字节大牛加入 | 智能涌现独家
文|邱晓芬编辑|苏建勋2023年底,全球出货量最大的动作捕捉设备提供商"诺亦腾(Noitom)"联合创始人戴若犁,一度以为自己被骗了
2025-09-23 20:47:00
近8成职场人每周都会使用AI工具 通用对话型AI占比最高
在人工智能技术日臻成熟的2025年,AI已不再是科幻概念或实验室产物,而是深度融入职场生态的“数字同事”。从“工具”走向“伙伴”
2025-09-23 11:37:00