• 我的订阅
  • 头条热搜
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
【新智元导读】近日,BitNet系列的原班人马推出了新一代架构:BitNet a4.8,为1 bit大模型启用了4位激活值,支持3 bit KV cache,效率再突破。量化到1 bit的LLM还能再突破?这次,他们对激活值下手了!近日,BitNet系列的原班人马推...……更多
石家庄人工智能计算中心:以智能算力激活新质生产力 助力数字经济高质量发展
...模型,助力具体行业的优化升级”。鹿泉区作为石家庄市新一代电子信息产业率先突破战略的承接地,目前聚集起了1000余家电子信息企业,在集成电路、现代通信、汽车电子、软件研发等领域形成了较为完整的产业链。未来,...……更多
rockaiyan架构大模型通过备案
...,上海岩芯数智人工智能科技有限公司(以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案,这是国内首个非Transformer架构大模型通过备案。Yan模型简介Yan架构大模型是国内首个非Transformer架构、非Atte...……更多
AI业务收入盈利双增,但百融云没有止步
...恩达曾在斯坦福做过一场主题演讲,他同样认为,AI作为新一代通用技术,更多机会在于大规模应用落地。向着月亮跑,最少也能收获一颗星星。AI和每次科技进步一样,就像一列已经开启的高铁,给踏空者补票的机会并不多。...……更多
专家模型不要专家并行!微软开源MoE新路径
...走寻常路」如果写个太长不看版,那就是两句话:1. 使用新一代SparseMixer来精确估计专家路由的梯度,解决传统方案中利用门控梯度代替路由梯度的问题。 2. 专家并行不要了,训练中改用数据、pipeline和张量并行,避免了传统方...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
【新智元导读】Time-MoE采用了创新的混合专家架构,能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集,为时序分析提供了丰富的训练资源,为各行各业的时间序列预测任务带来了新的解决方案。在当今以数...……更多
理想端到端+VLM智驾开启全量推送:原地P挡激活 上车就能开
...,涵盖理想MEGA、L9、L8、L7、L6的AD Max车型。理想表示,全新一代智驾具备安全、轻松的特性,“更像老司机”,在各种驾驶场景下,理想端到端+VLM的亮点能力也同步提升。例如,路边起步时,车辆在车位上,P挡就能激活端到端...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
9月5日,腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方...……更多
创鑫激光“萃炼成光”发布会 三个关键激活行业新方向
...强的竞争力。基于先进、成熟的集成大泵技术,创鑫激光新一代G6代产品硬件极致简化,以更小的体积重和更低的产品成本,实现了更高的可靠性、实用性和领先优势。根据数据统计,创鑫激光G6代产品的器件和熔接点,相比当...……更多
AMD展示锐龙AI PC“朋友圈” 剧透新一代处理器全面升级
...不仅锐龙8040系列正在出货,2024年AMD还将推出全面升级的新一代锐龙处理器,“StrixPoint”的CPU将采用Zen5架构,搭配RDNA3+架构GPU以及XDNA2架构的NPU。其中XDNA2架构设计旨在将NPU计算和代际的AITOP算力性能翻三倍。LisaSu博士表示:“...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强调模拟人类语言理解和生成方面的先进能力,为知识创造和信息...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...特征。此外,Gemma Scope使用了最新的、最先进的JumpReLU SAE架构进行了训练。原始的稀疏自编码器架构,在检测特征存在与估计强度这两个目标之间,往往难以平衡。而JumpReLU架构,就能更容易地实现二者的平衡,并且显著减少误...……更多
虚实相生擦火花 AI赋能文旅激活产业发展新增量
...景演示”。他说:“这是一种基于AI技术构建的智慧旅游新一代智能指挥中心,能够实现游前搜索分析、游中监管分析、游后舆情分析,同时联合城市信用管理体系,实现监测预警、投诉处理、应急指挥等多种功能的综合联动应...……更多
2023安博会 | “技”高一筹 大华股份用数智开启百业新篇
...筑数字新底座5G、人工智能、大数据、云计算等为代表的新一代数字技术改变了数据和信息的传输方式,开启了数字全球化的新时代。大华股份通过路由、交换、无线、网安等产品,实现智能终端、边缘计算、云端服务完成全融...……更多
激活数据价值!贵州:构建数据流通新生态 培育数字产业竞争力
...技集团有限公司为例,在使用金蝶为其提供开放的ERP建模架构,实现了生产制造要素全连接,通过各环节大量数据的采集,为每一道工序“算”出最优参数。金蝶软件外景 在贵阳,像这样的软件和信息服务企业超过6000家。2023...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...科学家林达华。过去一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验...……更多
中石油东北销售打造“敏捷型”组织 激活发展新动能
...业转型升级,公司在组织体系优化基础上,打破传统组织架构,根据业务需求灵活组建专项工作小组等“敏捷型”组织,通过合理配置人力资源,减少管理层级,提高工作效能。聚焦创新活力激活,培育敏捷文化氛围。打破单位...……更多
...复旦类脑智能科学与技术研究院加福民青年老师团队研发新一代用于脊髓损伤患者的植入式脑脊接口设备,为脊髓损伤患者带来站立行走的希望。日前,相关项目“植入式脑脊接口关键技术与系统研制”在约1400个参赛项目中脱...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...模型架构设计与训练中,采用了多个创新技术:包括通过新一代本文编码器提升语义遵循,自研 3D 视觉编码器支持图像视频混合训练,通过全注意力机制提升画面运镜能力,并根据自研的图像视频 Scaling Law 设计和训练了最优配...……更多
...药、新型材料、航空航天六大产业集群国内制高点,抢占新一代人工智能、第三代半导体、基因与细胞、元宇宙、未来网络与先进通信、储能与氢能六个未来产业新赛道,培育发展新动能。软件和信息服务产业规模已超过7400亿...……更多
智慧城市“解题人”
...“如今,物联网、云计算、大数据、空间地理信息集成等新一代信息技术,就是我们的‘新质生产力’!”郝敬全对比着10年前的智慧城市建设,“那时候更多的是停留在信息化建设层面,而现在我们更多的是要实现场景化的应...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...理过程中所需的显存/内存大小,例如上下文大小和模型架构 现在假设我们有一个包含700亿参数的模型。大多数模型本身使用32位浮点数(通常称为全精度)表示,这需要280GB的内存来加载模型。但如果能将所有参数用16位浮点数...……更多
谷歌Willow激活量子计算产业!中国企业弯道超车的机会?
...车的机会?AMD CEO苏姿丰曾表示,芯片的制程工艺和芯片架构同样重要。经过多年时间发展,制程工艺即将进入瓶颈期,或者说即将进入量子领域。制程工艺进入5nm后,就会出现量子隧穿效应(俗称“漏电”),电子会从一个晶...……更多
22年后英特尔放弃了超线程!Lunar Lake架构深度解析
...国台北举行的COMPUTEX2024展前发布会上,英特尔正式公布了新一代的AIPC处理器,也就是第二代酷睿Ultra中的移动版,代号为LunarLake的超低功耗处理器。要知道,酷睿Ultra(MeteorLake)是去年12月正式发布的,距今不过半年时间,彼时...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...第一个 100% 开源的混合专家 LLM。预训练与自适应预训练架构OLMoE 是由 N_L 个 transformer 层组成的语言模型,仅包含解码器。对于 OLMo 这样的密集模型,原本模型中单一的前馈网络被 N_E 个小型前馈网络(专家)组成的混合专家网络...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...AGI的多模态大模型,并利用这些自主研发的大模型,创造新一代的AI应用。 为着这个目标,这一年多来,阶跃已经写下了属于自己的答案。研发迭代速度很快,不到一年,无论Step-1到Step-2, 还是Step-1V到Step-1.5V,整体持续跑步前...……更多
...。数智化浪潮下,赛意信息深耕工业互联网、智能制造、新一代信息技术及数字化转型等领域,并联合华为云等合作伙伴,共同以数字化赋能经济发展,创新“智”造,助力企业高质量发展。从“单点突破”到“链式转型” 带...……更多
这次,华为真的“强得飞起”
...卫星互联网星座系统,争夺卫星频率和轨道资源,并构建新一代网络控制权。去年就曾有专家预言,2024年我国低轨道卫星发射将迎来一轮爆发,预计到2030年之后实现平均每年发射1800颗。(图/图虫创意)在这样的大背景之下,...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、阿里、腾讯等企业控制成...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...新数据,尤其在生成高质量逼真图像方面相较于其他模型架构具有显著优势。因此,尽管近年来也有基于 GPT 等其它架构的优秀图像、视频生成模型不断涌现,基于扩散模型的架构依然是当前大多数图像、视频生成任务的主流选...……更多
更多关于科技的资讯:
联通客户日 暖冬送温情——福建联通VIP客户答谢会在三明圆满落幕
活动现场。东南网11月26日讯(通讯员 肖锦雯)近日,以“联通客户日 暖冬回馈季”为主题的福建联通VIP客户答谢会在三明市徐锦新城小区温馨启幕
2025-11-26 12:50:00
梦百合家居董事长倪张根亮相沈阳“梦粉见面会”,发布适老化智能床新品
近日,知名睡眠品牌MLILY 梦百合在沈阳京东MALL发布适老化智能床系列新品,并针对沈阳大东区社会福利院展开公益捐赠
2025-11-26 13:04:00
BORCHERS®亮相中国国际涂料展,以本地化创新与全球技术推动行业可持续发展
在今天开幕的 2025 中国国际涂料展上,美利肯涂料添加剂品牌BORCHERS®于 W2.F21 展位(展馆 W2)再次携核心解决方案亮相
2025-11-26 13:37:00
国际大咖为“南京故事”国际传播支招在中国制作 向世界传播南报网讯(记者乔雅萱)11月22日上午,南京国际传播中心揭牌仪式现场
2025-11-26 10:27:00
江苏南京:链接全球资本!宁企赴港上市热潮涌动
□南京日报/紫金山新闻记者曹丽珍今年以来,一股赴港上市浪潮正在全国范围内持续奔涌。相关数据显示,今年前三季度,中国企业境外首次公开募股(IPO)的活跃度大幅回升
2025-11-26 10:27:00
江苏南京:一张购物小票,掘出一座“数据金山”
南京加快释放数据要素价值培育壮大数据产业一张购物小票,掘出一座“数据金山”晓数通社区微数据中心。 江苏荣泽信息科技股份有限公司供图数族科技
2025-11-26 10:27:00
南报网讯(记者朱旖旎通讯员刘芳)深秋的南京,一场跨越山海的双向奔赴正在发生。近日,2025中欧机器人产业合作(南京)对接会在栖霞区召开
2025-11-26 10:28:00
医疗器械“产学研医”对接会举办
近日,2025南京医疗器械“产学研医”对接会在高淳举办,高校、医院、企业等多方代表齐聚。活动搭建协同平台,助力产业创新与成果转化
2025-11-26 10:28:00
在长三角文博会上亮出“文化家底”和数字创新实力南京打造微短剧产业集聚高地□南京日报/紫金山新闻记者朱静近日,一场聚焦微短剧的产业合作交流活动在国家会展中心(上海)火热举办
2025-11-26 10:28:00
江苏南京:相约十年,让制造更聪明
相约十年,让制造更聪明——写在2025世界智能制造大会即将召开之际□南京日报/紫金山新闻记者徐宁 实习生黄倩“作为南京智能制造产业的标杆力量
2025-11-26 10:28:00
智能工厂运营效率提升
近日,在南京天加环境科技有限公司今年5月投产的天加洁净基地内,高度自动化生产线正生产发泡板机、换热器等核心零部件。该生产基地建立了从客户需求到最终交付的“端到端”全流程数字化运营体系
2025-11-26 10:28:00
东南网11月26日讯(福建日报记者 李珂) 记者从厦门大学获悉,日前,该校萨本栋微米纳米科学技术研究院吴德志教授团队在3D打印技术领域取得突破性进展——首创“激光原位诱导直写打印”技术
2025-11-26 10:34:00
厦门网讯(厦门日报记者 张珺 通讯员 吴冰冰)我市跨境电商生态再添新支点,日前,POD(按需定制)专卖孵化平台公司正式落户银城智谷海熹跨境电商产业园
2025-11-25 08:11:00
AI赋能千行百业一线故事(十七):这位“农事专家”,让种地更聪明
这位“农事专家”,让种地更聪明——AI赋能千行百业一线故事(十七)11月14日,雄安新区都市农业科技博览园温室大棚内,工作人员查看番茄长势
2025-11-25 08:41:00
荣耀加冕!锦程酒管多店荣登消费者喜爱榜-2025年中国高端酒店100强
2025 年 11 月 20 日-21日—— 在备受文旅与酒店行业瞩目的 “2025 迈点文旅节・第七届迈点酒店运营创新大会” 上
2025-11-25 09:25:00