• 我的订阅
  • 头条热搜
微软、英伟达纷纷押注小模型,大模型不香了?
...发展的道路上,科技巨头们曾经竞相开发规模庞大的语言模型,但如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,挑战着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型...……更多
微软难以摆脱英伟达 |焦点分析
...市场至少90%的份额。AI芯片是AI时代石油一般的存在。大模型公司想更快推出模型和AI应用,就必须大量购入英伟达的芯片。而英伟达的产能有限,按照上一年计划制定的供给,远不能满足蓬勃的市场需求,抢不到芯片的云厂商、...……更多
微软推出自研AI芯片:台积电5nm工艺、Open AI开启试用,想摆脱对英伟达依赖?
...能够带来终极效率、性能和规模。”对目前正在加速AI大模型服务布局的微软来说,自研芯片更多有着成本考虑,同时也能够避免过度依赖供应商,对其长期的商业化也将产生影响。 两款芯片均为5nm制程,OpenAI开启测试微软发...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
AI芯片下半场:英伟达不再一家独大
...开发者大会上,推出两款定制芯片,以应对不断增加的大模型训练成本挑战,并试图降低提供AI服务的成本。微软表示,新发布的芯片不会出售,仅供支持自己的产品,并作为微软云Azure云计算服务的一部分。微软最新推出的两...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...显存具备更大的容量和更高带宽,可以支持超大参数的大模型训练与推理。官方给出的参数显示,H200相较上一代产品在Llama2和ChatGPT的训练速度分别能提升40%和60%。 可以看出,从MI300X到H200,再到Maia100,大厂对训练参数量、训练...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...达的垄断地位。而AMD的MI300,在部署32K上下文窗口的GPT-4模型时,居然比H100效果更好?AI芯片大决战,即将来临!AI硬件开发商初创公司的未来会怎样?Tenstorrent CEO David Bennett直言不讳地表示,在我们这个行业,大部分初创公司的...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...新的石油。」图/ X(Twitter) 但算力依然受限,核心是大模型训练、推理都严重依赖于英伟达高端 GPU,而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底,还是算力不够用,「供给」赶不上...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...)Blackwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外,黄仁勋还在GTC大会推出了新一款...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
...100TensorCoreGPU,比上一代虚拟机性能更强大,可显著提升AI模型的训练和推理速度。同时,微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外,NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术,每个GPU……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...持平。在过去的一年里,大多数企业都将资源投入到了AI模型的训练中,因此需要大量的算力资源支撑,在部署空间有限的情况下,英伟达的H100显然是最好的选择。 更何况H100是英伟达在2022年3月份发布的GPU加速卡,从中也不难...……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
...算卡的算力还远远不够,尤其是像Sora这样的文生视频的模型出来,更是对计算卡的算力提出了更高的要求,于是英伟达也适时地推出了下一代GPU,在AI性能上有着突飞猛进的进步,可以说拉了竞争对手整整一代。英伟达在今天凌...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...AI能够做的工作有了更强烈的预期和紧迫感,而且各种大模型如雨后春笋一般地涌现出来,市场对于高性能芯片的需求度也爆棚了。黄仁勋推出B200的时候,人们忍不住要惊呼了。这是Hooper后的新一代架构,以数学家Blackwell命名。...……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...,1.5 倍的内存带宽以及 2 倍的网络带宽提升。同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。英特尔预计...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...MatX正在挑战英伟达在AI芯片领域的霸主地位,其为大语言模型训练而设计的AI芯片将于明年问世。这家公司的官网显示,使用MatX芯片,训练70B大模型的延迟将小于10ms/token。该公司还预言,使用其芯片训练,能够让世界上最好的...……更多
英伟达带来最强AI芯片,但赶超苹果又远了一步?
...25倍。叠加B200搭配的8颗HBM3e内存,最大可支持10万亿参数模型的训练。作为对比,OpenAI的GPT-3模型参数为1750亿,据黄仁勋透露,GPT-4模型参数约为1.8万亿。以训练一个1.8 万亿参数模型的GPT-4为例,之前需要用8000个Hopper GPU干的活儿...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
\\\
...图:英伟达AI产品更新路线图就性能的升级对比,H200在大模型Llama和GPT-3.5的输出速度分别是H100的1.9倍和1.6倍,在高性能计算方面的速度达到双核x86 CPU的110倍。而到了GB200,与H100相比,可以将LLM推理工作的性能提高30倍,并将成...……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...试用推广、团队扩张。 一、Copilot平台推出Agent能力,小模型满足端侧需求在Scaling Laws下,AI技术的能力大约每六个月就会翻倍增长。陶然谈道,如何让技术成果对齐行业、企业的实际业务需求,加速技术能力的落地转化,成为...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
最强大模型训练芯片H200发布!
...联技术,可以以最高性能运行各种应用负载,包括175B大模型的训练和推理。HGX板的独立性质使其能够插入合适的主机系统,从而允许使用者定制其高端服务器的非GPU部分。接下来是QuadGH200超算节点——它由4个GH200组成,而GH200是...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训
...标是实现最快的训练完成时间,计划本月晚些时候开始训模型。这将成为世界上最强的训练集群,优势不言而喻。我们决定自行建设10万块H100芯片系统,以及下一代主要系统的原因是,我们的核心竞争力取决于能否比其他AI公司...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...可用本地API的Copilot库WindowsCopilotLibrary,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PCCopilot+PC如何与AI应用程序(App)密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
文|尚恩编辑|邓咏仪封面来源|Figure“大模型”终于有实体了。美国时间3月13日,由OpenAI投资的机器人公司Figure发布了一段视频demo,视频里的机器人,不仅可以与人进行对话交互,理解人类的意图,而且还拥有记忆力。当工...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...求主要分为训练与推理两大阶段,训练可以理解为打磨大模型智能水平的过程,而推理则是在大模型应用过程中计算的过程。对于这两者的算力需求,一些机构提出了各自的估算方式,它们可以用一个公式来简单概况:每参数每...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...最先进的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但...……更多
“去英伟达化”加速!Meta、谷歌接连发布自研芯片,英伟达能否捍卫霸主地位?
...等外部芯片生产商的依赖,同时还允许公司根据自己的AI模型定制个性化的硬件。随着顶流AI工具ChatGPT的发布,生成式AI市场也引发了各大科技公司的竞相追逐,算力则是这一领域蓬勃发展背后的核心引擎。在这一背景下,作为...……更多
更多关于科技的资讯:
钻漏洞谋求个人私利:吉林一雪场将15名大学生拉入黑名单
快科技1月15日消息,国内不少景点会针对大学生等群体推出相应的优惠政策,有些甚至是免门票,然而这样的规则也会被有心人利用谋取私利
2025-01-15 17:25:00
小米超级小爱升级计划公布:小米13/K60等也能用上 1月27日前推送
快科技1月15日消息,小米官方今天发文宣布,澎湃OS 2系统中的「超级小爱」功能已正式向用户开放。该功能新增了手势唤醒和智能理解屏幕内容等特性
2025-01-15 17:25:00
高性能内存对于游戏帧率如此重要!英睿达DDR5 Pro 6400MHz评测
一、前言:专为锐龙9000平台设计的游戏内存内存延迟对于游戏帧率的重要性已无需赘述。由于Intel新一代酷睿Ultra 200S在游戏性能上的拉胯表现
2025-01-15 17:25:00
理想汽车推出2025新春活动攻略!涵盖充电免服务费等福利
快科技1月15日消息,理想汽车为庆祝2025年新春,推出了五重福利活动。活动从1月16日开始,至2月4日结束,期间理想汽车全系车型在全国范围内的高速理想超充站充电时
2025-01-15 17:25:00
网友申请退机票收到近七千元代金券 携程称系航司政策规定
快科技1月15日消息,据媒体报道,近日,有网友反映称,他在2024年11月,通过携程购买了12月21日的往返国际机票,总价为8279元人民币
2025-01-15 17:25:00
连续36年第一!中国第一个14万亿大省诞生 广东新能源汽车、手机产能激增
快科技1月15日消息,2024年广东GDP预计站上14万亿大关,成为我国第一个14万亿大省,连续36年蝉联全国榜首(已经全面赶超“亚洲四小龙”)
2025-01-15 17:25:00
男子聚餐后次日身亡9同事被告 法院:同饮者已尽合理注意义务 无责!
1月15日消息,外出聚餐莫劝酒,一旦出事情很有可能摊上官司,类似的事情已经不止一次发生,想必关注新闻的朋友都已了解。据CCTV法治在线报道
2025-01-15 17:25:00
史无前例!世界最大核能基地首创“和气一号”能源站
快科技1月15日消息,据报道,位于江苏连云港的田湾核电站,是全球在运+在建总装机容量最大的核电基地 。随着7、8号机组投产
2025-01-15 17:55:00
三星Galaxy S25欧版存储仍为128GB起售!亚洲地区256GB起售
快科技1月15日消息,三星Galaxy S25系列手机即将发布,不同市场的存储配置差异引发关注。据海外科技博主透露的消息来看
2025-01-15 17:55:00
铃木汽车将在印度利用牛粪生产车用沼气燃料 此前曾宣称要建沼气厂
快科技1月15日消息,据媒体报道,日本铃木汽车公司目前正在印度全力利用牛粪生产汽车用沼气燃料。据了解,在2024年12 月 25 日
2025-01-15 17:55:00
男子开火车卧铺车厢带全家自驾游:一辆车住了十几个人
快科技1月15日消息,近日,博主@ 狼先生~(卷儿哥)开着火车卧铺带全家人自驾游的视频,引起网友关注热议。据博主介绍,加上父母他们一行十多人
2025-01-15 18:25:00
2025支付宝集福玩法公布:每人5次!集齐立马开奖 不用等除夕
快科技1月15日消息,今天,支付宝正式官宣了2025支付宝集福玩法。今年的集五福将在1月20日启动,玩法相比以往有明显变化
2025-01-15 18:25:00
诺基亚与三星达成重磅协议!三星电视将用上诺基亚视频技术
快科技1月15日消息,诺基亚与三星签署多年期专利许可协议,三星电视将采用诺基亚视频技术。根据协议,三星将向诺基亚支付专利费用
2025-01-15 18:25:00
你见过活沙币吗
如果你在海滩上赶海时,捡到下图中的“白色圆盘”,你觉得最有可能是什么?是贝壳还是石块,抑或是古老的植物花瓣化石?海滩边上的“死沙币”图源sanddollarshelling真相也许会让你大吃一惊因为你捡到的其实是一枚沙币
2025-01-15 18:25:00
RTX4060游戏本便宜了 翼龙15 Pro双补仅5670元
快科技1月15日消息,机械革命翼龙15 Pro正在天猫旗舰店参加百亿补贴+国家补贴双重补贴活动中,到手价格仅5670.4元
2025-01-15 18:25:00