• 我的订阅
  • 头条热搜
手机市场深陷泥沼,厂商如何破冰?
...题,在这一关键节点,厂商们亟需新的解题思路。3、大模型被认为是下一突破点,但仍没合适的落地方式。自2023年初大模型成为互联网发展技术趋势的关键词,手机厂商关于大模型的探讨就一直没有停止。从逻辑上讲,手机厂...……更多
深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用De...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...变得儒雅随和:开启Apple Intelligence后,苹果自研的端侧大模型就会被下载到设备当中。根据手快的网友体验反馈,不像其他家的AI那样动不动就是拒绝服务。与此同时,苹果自家大模型的报告也已出炉,披露了大量技术细节。报...……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
落地端侧被认为是大模型走向普及的关键。个人PC和智能手机是当前受众最为广泛的两大终端品类。2023年下半年以来,全球范围内各大PC、手机厂商纷纷通过硬件扩容,尝试将大模型在物理意义上融入终端。直到近期,大模型融...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...et系列的原班人马推出了新一代架构:BitNet a4.8,为1 bit大模型启用了4位激活值,支持3 bit KV cache,效率再突破。量化到1 bit的LLM还能再突破?这次,他们对激活值下手了!近日,BitNet系列的原班人马推出了新一代架构:BitNet a4.8...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...AWS re:Invent大会上,AWS(亚马逊云科技)一口气发布6款大模型、预告2款大模型,还推出3nm第三代AI训练芯片Trainum3及其迄今最强AI服务器Trn2 UltraServer。这是Amazon Nova系列基础模型首次亮牌。包括Micro、Lite、Pro、Premier四……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...量化」的基本概念和分支方法进行了全方位总结。大语言模型(LLM)通常过于庞大,无法在消费级硬件上运行。这些模型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小...……更多
amd旗舰aigpu加速器mi300x对比英伟达h100
...0的1.3倍FP16TFLOPS精度是H100的1.3倍在1v1比较中,训练Llama270B模型速度比H100快20%在1v1比较中,训练FlashAttention2模型速度比H100快20%在8v8Server比较中,训练Llama270B模型速度比H100快40%在8v8Server比较中……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来,大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算...……更多
宝德携手英特尔至强W处理器加速数智创新应用
...盘,具备丰富的异构扩展性和灵活的连接能力,可支持大模型快速导入导出,从多方位驱动AIGC算力,满足不同行业用户的多样化需求。它拥有16个DDR4内存DIMM槽,具备出色的图形处理能力和数据计算能力,并且提供人机共存的静...……更多
...100TensorCoreGPU,比上一代虚拟机性能更强大,可显著提升AI模型的训练和推理速度。同时,微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外,NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术,每个GPU……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
...算卡的算力还远远不够,尤其是像Sora这样的文生视频的模型出来,更是对计算卡的算力提出了更高的要求,于是英伟达也适时地推出了下一代GPU,在AI性能上有着突飞猛进的进步,可以说拉了竞争对手整整一代。英伟达在今天凌...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...达:速度快20倍,价格仅为1/5AI推理指的是在训练好一个AI模型之后,使用这个模型对新的数据进行预测或决策的过程。AI推理的性能和效率对于实时应用至关重要,例如自动驾驶汽车、实时翻译或在线客服聊天机器人等。Cerebras I...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...AI Open Day正式举办。在现场,智谱AI发布了全新的开源大模型GLM-4系列、新API模型、MaaS 2.0大模型开放平台、智能体等等产品。5月的大模型“大促月”还没结束,智谱也再度跟进降价。比如,GLM-4-Flash轻量化版本,在企业优惠价下...……更多
美光、SK海力士公布SOCAMM内存模块:尺寸更小 功耗更低
...超过2.5倍的带宽,能够更快地访问大型训练数据集和复杂模型,同时提升推理工作负载的吞吐量。SOCAMM的尺寸为14 x 90毫米,仅为行业标准RDIMM尺寸的三分之一,有助于实现更紧凑、高效的服务器设计。同时,由于采用LPDDR5X技术...……更多
终结数据孤岛!百度智能云亮相TDBC大会:重塑数据与AI的连接方式
...,而是深陷数据治理的复杂迷宫中。当业界追逐千亿参数模型时,数据正成为制约AI价值落地的隐形瓶颈。在大模型技术高歌猛进的表象之下,数据困境呈现多维绞杀态势。文本、图像、音频、视频等多模态数据如同破碎拼图,传统工...……更多
前有雷军亲自交车,后有黄仁勋送货上门?全球首款AI超芯牛在哪?
...数据。如果没有DGX H200,用户可能需要数月才能构建大型模型,而借助一站式的超级AI芯片DGX GH200部署,时间将大幅减少至数周,就能构建大型模型,特别是对目前备受期待的GPT-5模型,它会助力带来令人疯狂的性能升级。英伟达...……更多
四月AI芯片三连发,英伟达:无惧竞争!
...款产品中,Intel新一代Gaudi3与NVIDIAH100展开直接竞争。在AI模型算力中,Gaudi3AI芯片的模型训练速度、推理速度都更出色,分别提升了40%和50%,平均性能提升达到了50%,能效更是提高了40%。更重要的是,Gaudi3AI芯片的成本比H100更低...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...一新兴的前沿领域还鲜少有人涉足,但绝对值得深耕!AI模型再扩展1000倍的秘密可能就藏在这里。随着Scaling Law越来越成功,LLM的电力和算力消耗也逐渐达到了惊人程度。我们越来越难以想象,当前的模型规模如何能再扩大10倍...……更多
国产GPU突破!摩尔线程发布Torch-MUSA v2.0.0:FP8原生支持
...A中,用户只需指定torch.device(\"musa\"),即可将现有的PyTorch模型迁移到MUSA架构的GPU上运行,无需大幅修改代码,目前Torch-MUSA已完全开源,可通过GitHub获取源代码。作为本次升级的核心亮点,Torch-MUSA v2.0.0率先在国产GPU上实现了……更多
手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行
有CPU就能跑大模型,性能甚至超过NPU/GPU!没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术——T-MAC。这项技术主打性价比,不仅能让端侧模型跑得更快,而且资源消耗量更少。咋做到的??在CPU上高效部署低...……更多
本周(4.8-4.14)AI界发生了什么?
...时间4月9日,谷歌、OpenAl、Mistral在24小时内,接连发布大模型重磅更新。谷歌正式发布了Gemini 1.5 Pro的多项更新,包括企业AI平台预览版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。 OpenAl则又一...……更多
ChatGPT一周年|炼制大模型芯片短缺数据有限,何以解忧?
...一夜坍塌的命运。这一年让我们产生了更多疑问:大语言模型下一步的进化方向是什么?AI芯片短缺何时解决?训练数据快要耗尽了吗?中国的百模之战会如何演化?AI技术发展应加速还是减速?。 算力与数据,是支撑大型语言...……更多
云和AI时代加速来临 腾讯云发布国产服务器操作系统TencentOS Server V3
...性能优化,虚拟机性能损耗小于2%的领先水平。AI步入大模型时代 资源的最大化利用成服务器OS关键命题目前,AI的发展已步入大模型时代,众所周知做大模型很“贵”,若能提高现有资源的利用效率,便能大幅降低大模型的建设...……更多
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
大语言模型(LLM)的发展同时往往伴随着硬件加速技术的进化,本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。对人类语言进行大规模建模是一个复杂的过程,研究人员花了几十年的时间才开发出来。这...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定大型语言模型的速度快40%,在推理端比英伟达H100快50%。基辛格在现场...……更多
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
【新智元导读】TimeMixer++是一个创新的时间序列分析模型,通过多尺度和多分辨率的方法在多个任务上超越了现有模型,展示了时间序列分析的新视角,在预测和分类等任务带来了更高的准确性和灵活性。在数据驱动的时代,时...……更多
三星推出新型存储器LLW DRAM,为人工智能市场注入新动力
...带宽、低延迟和低功耗的三大特性,旨在为运行大型语言模型(LLM)的设备提供强大的支持。 #热点引擎计划#在当今这个数据驱动的时代,大型语言模型已经成为了人工智能领域的重要组成部分。这些模型需要处理海量的数据,...……更多
更多关于科技的资讯:
虎鲸文娱人才创作基地落户陵水,助力海归青年创作者“回家筑梦”
日前,第七届海南岛国际电影节“青椰计划”特别活动——虎鲸文娱集团旗下大麦娱乐“海纳圆桌对谈”在三亚举行。虎鲸文娱集团正式宣布
2025-12-08 13:54:00
平台默认勾选开启、强制关联支付软件、开通容易取消难……网络上,有关免密支付的“吐槽”层出不穷,反映出消费者对加强支付业务安全管理的迫切愿望
2025-12-08 12:30:00
新闻纵深·冀货出海新探索|平乡自行车童车:从“贴牌代工”到“骑向全球”
平乡自行车童车出口销量占国际市场的百分之四十从“贴牌代工”到“骑向全球”阅读提示平乡县,被誉为“中国童车之都”。在这里
2025-12-08 08:26:00
杭州市康复医院近日组织开展第34个国际残疾人日宣传教育活动。“杭州市智能仿生假肢适配服务基地”在本次活动上揭牌成立。未来将为肢体残疾人提供智能仿生假肢适配相关服务
2025-12-08 09:24:00
米连科技率先跑通新赛道,成实时视频情感社交重要实践者与引导者
当众多社交平台仍在探索可持续的商业模式时,米连科技通过将“视频社交+实时互动”作为产品核心,不仅成功开辟了新的市场空间
2025-12-08 09:24:00
国际人才嘉年华2025(秋季)盛大启幕丨科创动能全景绽放,多元机遇职引未来!
《2025年世界人才排名》显示,香港已跃居全球第四、亚洲首位,彰显了港府近期在人才引进与培育方面取得显著成效。港府推行的多项人才计划累计收到申请逾52万份
2025-12-08 10:24:00
“苏新消费·暖冬购物季”正式启动 苏宁易购这波精彩 很给“利”
12月5日,2025“苏新消费·暖冬购物季”正式启幕,本次购物季将持续至2026年3月。重点围绕十三地市“苏品苏货”,结合“双12”
2025-12-08 10:28:00
工行河北省分行:金融“活水”浇开智造之花 为科技自立自强蓄能加力
从7人团队起步,到现已成长为年营收超40亿元的全国电气百强企业,科林电气在智能电网领域成果斐然。工行河北省分行以源源不断的金融活水和与时俱进的智慧服务精准滴灌
2025-12-08 10:36:00
近期,民生银行张家口分行全面开展“金融护航·幸福养老”主题宣传活动,以专业服务赋能养老规划,以暖心举措守护金融安全。多维布局
2025-12-08 10:41:00
王涵不是戴上面具之后才能放飞自我,而是那个看似放飞的自我其实是面具的产物。对于社会交往而言,认为需要加入或取消某种媒介才能体验交往的快乐
2025-12-08 10:54:00
人工智能不仅是一种技术,也是一个产业,更是一个时代。最近,AI杭州的目光纷纷投向钱江世纪城。先是长三角首个“芯-模-用”全链条AI产业社区芯模社区启航
2025-12-08 07:52:00
为期三天的消费狂欢落下帷幕!12月7 日,第六届杭州市中小商贸流通企业服务节暨2025惠民汽车消费季在拱墅区运河广场圆满收官
2025-12-08 07:52:00
刘沛雨摘要:本文主要从转型升级时期中小企业的管理创新方面展开分析,在市场发展变化迅速的局面下,通过应用一些管理创新手段和方法
2025-12-08 05:10:00
正值中国首个跨境电商综试区——杭州综试区设立十周年,也恰逢亚马逊全球开店(以下简称“亚马逊”)业务在中国开展运营十周年的重要里程碑
2025-12-08 07:21:00
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00