• 我的订阅
  • 头条热搜
微软、英伟达纷纷押注小模型,大模型不香了?
...发展的道路上,科技巨头们曾经竞相开发规模庞大的语言模型,但如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,挑战着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型...……更多
微软难以摆脱英伟达 |焦点分析
...市场至少90%的份额。AI芯片是AI时代石油一般的存在。大模型公司想更快推出模型和AI应用,就必须大量购入英伟达的芯片。而英伟达的产能有限,按照上一年计划制定的供给,远不能满足蓬勃的市场需求,抢不到芯片的云厂商、...……更多
微软推出自研AI芯片:台积电5nm工艺、Open AI开启试用,想摆脱对英伟达依赖?
...能够带来终极效率、性能和规模。”对目前正在加速AI大模型服务布局的微软来说,自研芯片更多有着成本考虑,同时也能够避免过度依赖供应商,对其长期的商业化也将产生影响。 两款芯片均为5nm制程,OpenAI开启测试微软发...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
AI芯片下半场:英伟达不再一家独大
...开发者大会上,推出两款定制芯片,以应对不断增加的大模型训练成本挑战,并试图降低提供AI服务的成本。微软表示,新发布的芯片不会出售,仅供支持自己的产品,并作为微软云Azure云计算服务的一部分。微软最新推出的两...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...显存具备更大的容量和更高带宽,可以支持超大参数的大模型训练与推理。官方给出的参数显示,H200相较上一代产品在Llama2和ChatGPT的训练速度分别能提升40%和60%。 可以看出,从MI300X到H200,再到Maia100,大厂对训练参数量、训练...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...达的垄断地位。而AMD的MI300,在部署32K上下文窗口的GPT-4模型时,居然比H100效果更好?AI芯片大决战,即将来临!AI硬件开发商初创公司的未来会怎样?Tenstorrent CEO David Bennett直言不讳地表示,在我们这个行业,大部分初创公司的...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...新的石油。」图/ X(Twitter) 但算力依然受限,核心是大模型训练、推理都严重依赖于英伟达高端 GPU,而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底,还是算力不够用,「供给」赶不上...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...)Blackwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外,黄仁勋还在GTC大会推出了新一款...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
...100TensorCoreGPU,比上一代虚拟机性能更强大,可显著提升AI模型的训练和推理速度。同时,微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外,NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术,每个GPU……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...持平。在过去的一年里,大多数企业都将资源投入到了AI模型的训练中,因此需要大量的算力资源支撑,在部署空间有限的情况下,英伟达的H100显然是最好的选择。 更何况H100是英伟达在2022年3月份发布的GPU加速卡,从中也不难...……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
...算卡的算力还远远不够,尤其是像Sora这样的文生视频的模型出来,更是对计算卡的算力提出了更高的要求,于是英伟达也适时地推出了下一代GPU,在AI性能上有着突飞猛进的进步,可以说拉了竞争对手整整一代。英伟达在今天凌...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...AI能够做的工作有了更强烈的预期和紧迫感,而且各种大模型如雨后春笋一般地涌现出来,市场对于高性能芯片的需求度也爆棚了。黄仁勋推出B200的时候,人们忍不住要惊呼了。这是Hooper后的新一代架构,以数学家Blackwell命名。...……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...,1.5 倍的内存带宽以及 2 倍的网络带宽提升。同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。英特尔预计...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...MatX正在挑战英伟达在AI芯片领域的霸主地位,其为大语言模型训练而设计的AI芯片将于明年问世。这家公司的官网显示,使用MatX芯片,训练70B大模型的延迟将小于10ms/token。该公司还预言,使用其芯片训练,能够让世界上最好的...……更多
英伟达带来最强AI芯片,但赶超苹果又远了一步?
...25倍。叠加B200搭配的8颗HBM3e内存,最大可支持10万亿参数模型的训练。作为对比,OpenAI的GPT-3模型参数为1750亿,据黄仁勋透露,GPT-4模型参数约为1.8万亿。以训练一个1.8 万亿参数模型的GPT-4为例,之前需要用8000个Hopper GPU干的活儿...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
\\\
...图:英伟达AI产品更新路线图就性能的升级对比,H200在大模型Llama和GPT-3.5的输出速度分别是H100的1.9倍和1.6倍,在高性能计算方面的速度达到双核x86 CPU的110倍。而到了GB200,与H100相比,可以将LLM推理工作的性能提高30倍,并将成...……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...试用推广、团队扩张。 一、Copilot平台推出Agent能力,小模型满足端侧需求在Scaling Laws下,AI技术的能力大约每六个月就会翻倍增长。陶然谈道,如何让技术成果对齐行业、企业的实际业务需求,加速技术能力的落地转化,成为...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
最强大模型训练芯片H200发布!
...联技术,可以以最高性能运行各种应用负载,包括175B大模型的训练和推理。HGX板的独立性质使其能够插入合适的主机系统,从而允许使用者定制其高端服务器的非GPU部分。接下来是QuadGH200超算节点——它由4个GH200组成,而GH200是...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训
...标是实现最快的训练完成时间,计划本月晚些时候开始训模型。这将成为世界上最强的训练集群,优势不言而喻。我们决定自行建设10万块H100芯片系统,以及下一代主要系统的原因是,我们的核心竞争力取决于能否比其他AI公司...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...可用本地API的Copilot库WindowsCopilotLibrary,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PCCopilot+PC如何与AI应用程序(App)密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
文|尚恩编辑|邓咏仪封面来源|Figure“大模型”终于有实体了。美国时间3月13日,由OpenAI投资的机器人公司Figure发布了一段视频demo,视频里的机器人,不仅可以与人进行对话交互,理解人类的意图,而且还拥有记忆力。当工...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...求主要分为训练与推理两大阶段,训练可以理解为打磨大模型智能水平的过程,而推理则是在大模型应用过程中计算的过程。对于这两者的算力需求,一些机构提出了各自的估算方式,它们可以用一个公式来简单概况:每参数每...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...最先进的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但...……更多
“去英伟达化”加速!Meta、谷歌接连发布自研芯片,英伟达能否捍卫霸主地位?
...等外部芯片生产商的依赖,同时还允许公司根据自己的AI模型定制个性化的硬件。随着顶流AI工具ChatGPT的发布,生成式AI市场也引发了各大科技公司的竞相追逐,算力则是这一领域蓬勃发展背后的核心引擎。在这一背景下,作为...……更多
更多关于科技的资讯:
周鸿祎批PPT无用:华丽掩盖了空洞!黄仁勋、马斯克都不用
快科技12月27日消息,360集团董事长周鸿祎昨日发布视频,谈到了自己为何特别反感只会“管理”的管理层,其表示:“我特别反感只打嘴炮或者不干活的管理层
2024-12-27 10:08:00
理想全新车机界面曝光:全屏展示智驾轨迹 科幻感十足
快科技12月27日消息,近日,一位博主展示了理想汽车最新的智能驾驶轨迹展示界面,揭示了其车机系统实现端到端驾驶状态的能力
2024-12-27 10:08:00
年底换机购机攻略:还得是年轻人专属华为“nova 13香”
不知不觉2024年马上就要结束了,不少人想趁年底换个新手机,但可能会纠结要选哪款,建议有需求的朋友可以考虑一下华为nova 13系列
2024-12-27 10:08:00
蔚来版“Model Y杀手”:乐道L60上市100天累计交付超20000台
快科技12月27日消息,乐道品牌公布首款车型乐道L60最新数据,其已达成上市100天累计交付超20000台的阶段目标。作为全新的品牌
2024-12-27 10:08:00
本文转自:人民网人民网记者 王绍绍从全球首款自动驾驶物流无人机的大规模商用,到基于AI的个性化药物研发平台的成功构建,再到智能物联网技术在智慧城市中的广泛应用……近年来
2024-12-27 10:31:00
华为首款百万级豪华轿车 尊界S800极寒测试:不怒自威
快科技12月27日消息,鸿蒙智行首款售价超百万的豪华轿车尊界S800已经亮相并开启预售,今日,官方发布了该车的最新官图
2024-12-27 10:38:00
AI的尽头是能源!奥特曼的核能公司Oklo签署重大合作协议
快科技12月27日消息,山姆·阿尔特曼(Sam Altman)的核能公司Oklo宣布了一项重大合作进展,Oklo在12月18日与美国数据中心巨头Switch签署了初步的非约束性协议
2024-12-27 10:38:00
戴先任随着近年来生成式人工智能技术的快速发展以及新职业的落地,与之相关的技能、人才培训市场也日渐火爆。不少培训机构纷纷推出人工智能相关课程
2024-12-27 10:38:00
2024年最后一款大作!网易国产武侠游戏《燕云十六声》PC今日正式公测
快科技12月27日消息,今日,2024年最后一款大作——网易旗下国产武侠游戏《燕云十六声》PC正式公测。官表示,过去几次测试中
2024-12-27 10:38:00
OPPO Find N5春季登场:首款骁龙8至尊版大折叠屏
快科技12月27日消息,OPPO周意保发文预热OPPO Find N5折叠屏,他表示,接下来Find系列的节奏会稳定下来
2024-12-27 10:38:00
索尼不明白《猎人克莱文》有什么不好
索尼影业首席执行官托尼不理解近期上映的《猎人克莱文》为何会失败,该片创下托尼职业生涯最糟糕首映票房。《猎人克莱文》本月14号在北美及中国大陆首映
2024-12-27 10:38:00
未来人类预告18寸巨无霸游戏本:192GB内存、奇特双网口
快科技12月27日消息,未来人类(TerransForce)官方宣布,即将推出一款18寸的巨型游戏本,会配备4K屏幕、192GB内存
2024-12-27 10:38:00
电梯加装背后的成本——项目审计费用知多少
当老旧小区迎来新生,电梯加装成为热议话题,你是否好奇这一改造项目的背后,除了电梯本身的费用,还有哪些隐藏的成本?今天,我们就来聊聊电梯加装中不可或缺的一环——项目审计费用
2024-12-27 10:40:00
齐鲁晚报·齐鲁壹点 于民星数字化时代,人工智能浪潮席卷全球,重塑各个行业格局,成为推动时代进步的重要引擎。工信部成立人工智能标准化技术委员会
2024-12-27 10:44:00
济南市家电圈大事件:海尔聪明风空调震撼发布!
鲁网12月27日讯在这个寒风凛冽的冬日里,济南市家电圈迎来了一场前所未有的盛事!2024年12月25日,所有家电商的精英们纷纷齐聚喜来登酒店
2024-12-27 10:44:00