• 我的订阅
  • 头条热搜
没有这些,别妄谈做 ChatGPT 了
...在用行动来表明战斗力,比如前些天复旦大学推出的 MOSS 模型,一经开放试用,便冲上热搜。一时间眼花缭乱,让人生疑。有钱就能训出模型?以美团大佬带资入组为代表,很多创业者和投资人盯上了 ChatGPT,作为一个 NLPer,我...……更多
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
摩尔线程GPU千卡集群完成师者AI 70亿参数教育大模型训练测试
快科技6月14日消息,摩尔线程与全学科教育AI大模型“师者AI”联合宣布,双方已完成大模型训练测试。师者AI基于摩尔线程夸娥(KUAE)千卡智算集群,完成了其70亿参数大模型的高强度训练测试。整个训练过程用时一周,训练...……更多
国内最大智算中心正式投用:每秒690亿亿次浮点运算 可训练万亿参数大模型
...所有AI加速卡打造成1个集群,用以支持千万亿级参数的大模型进行训练。这个集群智算中心通过先进的智算网络技术把上万块GPU芯片像“积木”一样拼接在一起,大幅提升GPU节点间的通信效率,将数据训练完成时间缩短20%,从而...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算领域,与国内主流AI芯片厂商深度合作,共同搭建的「国产千卡智算集群」现已上线...……更多
摩尔线程kuae千卡集群正式落地
12月19日消息,摩尔线程今日宣布,首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京成功举办,宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地,大模型智算加速卡MTTS4000也同步发布。...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...张建中抛出一句掷地有声的断言。为什么必须是万卡?大模型行业变化很快,客户希望两周内结束战斗,最迟也得在1个月内训练完。假设训练一个5000亿参数模型,有15TB数据,如果只有1000P算力,3年都训不完;如果将时间锁到两...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...球科技公司Yandex推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。据介绍,YaFSDP是目前在大型语言模型训练中增强图形处理器(GPU)通信并减少内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量...……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...。供求关系紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力需求每3~4个月就翻一番,每年训练AI模型所需算力增幅高达10倍,而生成式AI使上升曲线进一步陡峭,...……更多
超30个国产大模型混战:华为百度阿里腾讯,谁能成为“中国的OpenAI”?
...上万张GPU训练算力,并成立对标OpenAI的X.AI公司以开发大模型。ChatGPT引爆的AI大模型,正在成为全球科技巨头竞相追逐的新战场。国外有微软、谷歌、亚马逊,国内更是遍地开花。“大模型发布月”名不虚传,刚刚过去的一周基...……更多
国产GPU为底座,摩尔线程首个千卡智算中心落地
...2月19日,观察者网了解到,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京举办,这宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。与此同时,摩尔线程联合国内众多合作...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
为满足大模型的“暴力”计算需求,国内GPU企业正加码算力基础设施建设。12月19日,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心落地。据其介绍,这是国内首个以国产全功能GPU为底座的大规模算力集群...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...团副总裁、政企业务总裁李强表示,腾讯不仅通过自研大模型服务千行百业,也拥有坚实的AI基础设施服务,为中国大模型产业繁荣发展提供技术支撑。去年9月,腾讯全链路自研的腾讯混元大模型正式亮相。根据沙利文的权威报...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...转自:中国新闻网6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE...……更多
连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2
...上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。夸娥1.2主要升级点:▼MFU提升10% 最高可达55%在新版本中,使用千卡集群训练千亿模型,MFU(模型算力利用率)提升10%。稠密模型集群训...……更多
兔年拜年爆火新玩法:三秒变成年画娃娃
...。年画娃娃的核心技术是生成式AI,使用了多个前沿的AI模型。用两个字生成春联,这是自然语言生成大模型,里面有上百亿参数,经过了复杂的预训练。输入照片就能变身年画娃娃,同时调用了多个视觉AI模型,它们能够根据上...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求
...展正在进入“深水区”。随着生成式AI的迭代和发展,大模型规模以惊人的速度扩展,万亿参数级别几乎成为通用大模型的标配,由此带来的是算力需求的急剧增长。作为践行《新型数据中心“算力浦江”行动计划(2022-2024年)...……更多
从云栖大会,看阿里的科技本色
...火热的背景下,此次云栖大会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国内唯一将自研大模型开...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...双方此次合作旨在聚焦数字安全、信息与数字化服务及大模型等领域的创新应用,共同构建一个更加强大、可靠的人工智能生态系统,为各行各业提供先进的技术支持和服务。双方还将携手打造“360 智脑大模型一体机”,加速...……更多
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...张卡的训练集群,研发MegaScale生产系统,用于训练大语言模型;科大讯飞2023年建成了首个支持大模型训练的超万卡集群算力平台“飞星一号”。7月1日,腾讯宣布其自研星脉高性能计算网络全面升级,升级后的星脉网络2.0搭载全...……更多
国内首个以国产全功能GPU为底座的大规模算力集群正式落地
...摩尔线程官方发布通告称,摩尔线程首个全国产千卡千亿模型训练平台,摩尔线程KUAE智算中心揭幕仪式成功举办。此举也代表着,国内首个以国产全功能GPU为底座的大规模算力集群正式落地。摩尔线程CEO张建中表示,摩尔线程...……更多
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
...了1000到10000倍!如果可以使用世界上所有的算力来训练AI模型,会怎么样?近日,凭借发布了开源的Hermes 3(基于Llama 3.1)而引起广泛关注的Nous Research,再次宣布了一项重大突破——DisTrO(分布式互联网训练)。通过使用与架构...……更多
大模型涌现前,巨头涌入AI广告
...稿)》公开征求意见。同日,阿里发布“通义千问”AI大模型,在此之前,百度、华为、腾讯、昆仑万维等科技巨头在大模型方面也有布局动作。从巨头入场到监管推进,生成式AI在国内的发展脚步不断加快,这也将从更多层面...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...动做收缩调整。商汤在财报中指出,受惠于中国市场对大模型和智算服务的强劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降,带动模型调用量增长迅速。报告期内,“绝影”智能汽车业务的表现也...……更多
中国西部“最强大脑”每秒运算30亿亿次,人工智能将改变一座城
...语(西安)科技有限公司共同打造了一套千亿参数视觉大模型“秦岭·秦川交通大模型”,正在解决这一问题。张云鹏告诉上游新闻记者,研发的这套交通大模型,利用海量的历史交通数据,进行人工智能学习和分析,交通大模...……更多
大模型时代的阿里云,将云计算进行到底
文|葛覃大模型与云计算,正在成为新时代的淘金者和卖铲人。自ChatGPT刷屏之后的数月时间,微软Azure与OpenAI的示范效应传导至全球,基本所有能做大模型的厂商都尝试“淘金”,其中,云厂商是一股重要力量,云计算天然适...……更多
更多关于科技的资讯:
华强北iPhone16系列报价表一览:苹果今年惨 只有Max溢价
苹果iPhone16系列新机已于9月20日正式开售。对于想购买或者想出手转让iPhone16系列新机的朋友,不妨先浏览下深圳华强北的报价
2024-09-21 21:25:00
北京首个万兆宽带 遭遇百度网盘非VIP 秒变2G网络
快科技9月21日消息,日前,北京联通联合华为,正式发布万兆宽带,999元/月。朝阳区一位B站UP主成为首位用户,经过实测
2024-09-21 21:25:00
余承东谈飞机上被拍到使用华为Mate XT非凡大师:泄密要被罚款
快科技9月21日消息,9月20日,全球首款三折叠机型华为Mate XT非凡大师正式开卖,起售价是19999元。早在发布之前
2024-09-21 21:55:00
迈向AI时代的新出版如何实现创新发展?这场数字出版创新发展论坛深度探讨
南海网记者 汪慧随着人工智能(AI)的快速发展,科技与出版传媒深度融合已经走向纵深。出版业如何应对人工智能带来的变革,成为出版传媒业高质量发展的新命题
2024-09-21 22:07:00
台风普拉桑复活了:再度加强为热带风暴级
9月21日消息,据中国天气消息,今年第14号台风“普拉桑”减弱后的热带低压昨天晚上移入黄海南部海面后强度有所加强,今天凌晨再度加强为热带风暴级
2024-09-21 22:25:00
2024年太原马拉松赛9月22日燃情开跑,为确保这场家门口的国际体育盛事网络通信安全畅通,山西移动太原分公司以一系列先进技术手段
2024-09-21 22:43:00
华硕Prime RTX 4070 Ti SUPER显卡亮相
今年6月,华硕推出了PrimeGeForceRTX40系列显卡,首批共有三款GPU,分别是RTX4060Ti、RTX4070和RTX4070SUPER
2024-09-21 22:43:00
赛睿推出Arctis Nova 5白色系列耳机
赛睿(SteelSeries)宣布,推出ArctisNova5白色系列无线耳机,为用户带来了时尚的新配色。除了正常版本外
2024-09-21 22:44:00
传AI芯片设计公司Ampere寻求出售,或选择放弃IPO
据DigiTimes报道,有知情人士透露,由甲骨文公司(Oracle)创始人LarryEllison所支持的AI芯片设计公司Ampere正在探索出售的潜在可能性
2024-09-21 22:44:00
疑似英特尔Core Ultra 9 285K包装曝光
代号为ArrowLake-S的酷睿Ultra200系列桌面处理器已经确认会在10月10日发布,不过上市时间从原本的10月17日推迟到10月24日
2024-09-21 22:44:00
海韵推出CORE GX ATX3系列电源
9月20日,海韵正式推出了COREGXATX3系列电源。根据官方介绍,海韵COREGXATX3系列电源中文名为“游戏酷核”
2024-09-21 22:45:00
更多英特尔Arrow Lake-S零售包装曝光
英特尔已敲定了代号“ArrowLake-S”的酷睿Ultra200系列台式机处理器在2024年10月10日发布,不过上市时间从10月17日延后至10月24日
2024-09-21 22:45:00
七彩虹iGame Ultra系列全家桶装机体验
说到电脑硬件“全家桶”,可能大部分玩家第一时间会想到“ROG”,他作为目前电脑市场上生态产品运营的巨头,希望自家的品牌能够覆盖到电脑的每一个配件上面
2024-09-21 22:45:00
高通已向英特尔提出收购建议,交易完成后或将其部分资产出售
本月初就有报道称,过去几个月里,高通一直在研究收购英特尔部分设计业务的可能性,以增强旗下的产品组合。高通对英特尔所有的设计部门进行了评估
2024-09-21 22:45:00
雷神推出CF25F300L显示器
9月20日晚,雷神(ThundeRobot)正式推出了CF25F300L显示器,目前该显示器已上架京东商城并开启预约活动
2024-09-21 22:46:00