• 我的订阅
  • 头条热搜
微软、英伟达纷纷押注小模型,大模型不香了?
...发展的道路上,科技巨头们曾经竞相开发规模庞大的语言模型,但如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,挑战着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型...……更多
微软难以摆脱英伟达 |焦点分析
...市场至少90%的份额。AI芯片是AI时代石油一般的存在。大模型公司想更快推出模型和AI应用,就必须大量购入英伟达的芯片。而英伟达的产能有限,按照上一年计划制定的供给,远不能满足蓬勃的市场需求,抢不到芯片的云厂商、...……更多
微软推出自研AI芯片:台积电5nm工艺、Open AI开启试用,想摆脱对英伟达依赖?
...能够带来终极效率、性能和规模。”对目前正在加速AI大模型服务布局的微软来说,自研芯片更多有着成本考虑,同时也能够避免过度依赖供应商,对其长期的商业化也将产生影响。 两款芯片均为5nm制程,OpenAI开启测试微软发...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
AI芯片下半场:英伟达不再一家独大
...开发者大会上,推出两款定制芯片,以应对不断增加的大模型训练成本挑战,并试图降低提供AI服务的成本。微软表示,新发布的芯片不会出售,仅供支持自己的产品,并作为微软云Azure云计算服务的一部分。微软最新推出的两...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...显存具备更大的容量和更高带宽,可以支持超大参数的大模型训练与推理。官方给出的参数显示,H200相较上一代产品在Llama2和ChatGPT的训练速度分别能提升40%和60%。 可以看出,从MI300X到H200,再到Maia100,大厂对训练参数量、训练...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...达的垄断地位。而AMD的MI300,在部署32K上下文窗口的GPT-4模型时,居然比H100效果更好?AI芯片大决战,即将来临!AI硬件开发商初创公司的未来会怎样?Tenstorrent CEO David Bennett直言不讳地表示,在我们这个行业,大部分初创公司的...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...新的石油。」图/ X(Twitter) 但算力依然受限,核心是大模型训练、推理都严重依赖于英伟达高端 GPU,而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底,还是算力不够用,「供给」赶不上...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...)Blackwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外,黄仁勋还在GTC大会推出了新一款...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
...100TensorCoreGPU,比上一代虚拟机性能更强大,可显著提升AI模型的训练和推理速度。同时,微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外,NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术,每个GPU……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...持平。在过去的一年里,大多数企业都将资源投入到了AI模型的训练中,因此需要大量的算力资源支撑,在部署空间有限的情况下,英伟达的H100显然是最好的选择。 更何况H100是英伟达在2022年3月份发布的GPU加速卡,从中也不难...……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
...算卡的算力还远远不够,尤其是像Sora这样的文生视频的模型出来,更是对计算卡的算力提出了更高的要求,于是英伟达也适时地推出了下一代GPU,在AI性能上有着突飞猛进的进步,可以说拉了竞争对手整整一代。英伟达在今天凌...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...AI能够做的工作有了更强烈的预期和紧迫感,而且各种大模型如雨后春笋一般地涌现出来,市场对于高性能芯片的需求度也爆棚了。黄仁勋推出B200的时候,人们忍不住要惊呼了。这是Hooper后的新一代架构,以数学家Blackwell命名。...……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...,1.5 倍的内存带宽以及 2 倍的网络带宽提升。同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。英特尔预计...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...MatX正在挑战英伟达在AI芯片领域的霸主地位,其为大语言模型训练而设计的AI芯片将于明年问世。这家公司的官网显示,使用MatX芯片,训练70B大模型的延迟将小于10ms/token。该公司还预言,使用其芯片训练,能够让世界上最好的...……更多
英伟达带来最强AI芯片,但赶超苹果又远了一步?
...25倍。叠加B200搭配的8颗HBM3e内存,最大可支持10万亿参数模型的训练。作为对比,OpenAI的GPT-3模型参数为1750亿,据黄仁勋透露,GPT-4模型参数约为1.8万亿。以训练一个1.8 万亿参数模型的GPT-4为例,之前需要用8000个Hopper GPU干的活儿...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
\\\
...图:英伟达AI产品更新路线图就性能的升级对比,H200在大模型Llama和GPT-3.5的输出速度分别是H100的1.9倍和1.6倍,在高性能计算方面的速度达到双核x86 CPU的110倍。而到了GB200,与H100相比,可以将LLM推理工作的性能提高30倍,并将成...……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...试用推广、团队扩张。 一、Copilot平台推出Agent能力,小模型满足端侧需求在Scaling Laws下,AI技术的能力大约每六个月就会翻倍增长。陶然谈道,如何让技术成果对齐行业、企业的实际业务需求,加速技术能力的落地转化,成为...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
最强大模型训练芯片H200发布!
...联技术,可以以最高性能运行各种应用负载,包括175B大模型的训练和推理。HGX板的独立性质使其能够插入合适的主机系统,从而允许使用者定制其高端服务器的非GPU部分。接下来是QuadGH200超算节点——它由4个GH200组成,而GH200是...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训
...标是实现最快的训练完成时间,计划本月晚些时候开始训模型。这将成为世界上最强的训练集群,优势不言而喻。我们决定自行建设10万块H100芯片系统,以及下一代主要系统的原因是,我们的核心竞争力取决于能否比其他AI公司...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...可用本地API的Copilot库WindowsCopilotLibrary,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PCCopilot+PC如何与AI应用程序(App)密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
文|尚恩编辑|邓咏仪封面来源|Figure“大模型”终于有实体了。美国时间3月13日,由OpenAI投资的机器人公司Figure发布了一段视频demo,视频里的机器人,不仅可以与人进行对话交互,理解人类的意图,而且还拥有记忆力。当工...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...求主要分为训练与推理两大阶段,训练可以理解为打磨大模型智能水平的过程,而推理则是在大模型应用过程中计算的过程。对于这两者的算力需求,一些机构提出了各自的估算方式,它们可以用一个公式来简单概况:每参数每...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...最先进的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但...……更多
“去英伟达化”加速!Meta、谷歌接连发布自研芯片,英伟达能否捍卫霸主地位?
...等外部芯片生产商的依赖,同时还允许公司根据自己的AI模型定制个性化的硬件。随着顶流AI工具ChatGPT的发布,生成式AI市场也引发了各大科技公司的竞相追逐,算力则是这一领域蓬勃发展背后的核心引擎。在这一背景下,作为...……更多
更多关于科技的资讯:
价格接近400万元!法拉利首款纯电动车将于今年秋季发布
快科技2月5日消息,日前,法拉利首席执行官在财务业绩发布会上证实,法拉利首款纯电动汽车将于今年秋季发布,具体日期或为10月9日
2025-02-05 16:42:00
告别黄牛!任天堂为Switch 2大量备货:信心满满保障需求
快科技2月5日消息,任天堂即将发布的Switch 2游戏机备受玩家期待,而任天堂也正在积极准备,以确保这款新游戏机不会重蹈初代Switch因缺货而被黄牛囤积炒卖的覆辙
2025-02-05 16:42:00
舒适防臭耐磨:三枪中筒男女运动商务袜5双到手14.9元
天猫三枪袜品旗舰店,三枪中筒男女运动商务袜5双当前售价24.9元,限时限量10元券,实付14.9元包邮。款式简约百搭,舒适防臭又耐磨
2025-02-05 16:42:00
无人机避障黑科技横空出世!时速73km 夜间也能跟踪目标
快科技2月5日消息,据媒体报道,近日,中国香港大学科技团队研发的无人机自主避障技术,吸引了众多无人机爱好者的目光。据介绍
2025-02-05 16:42:00
轴距加长赶上X5 新一代国产宝马X3配置曝光:选装很丰富
快科技2月5日消息,近日,新一代国产宝马X3的相关消息曝光,包括部分配置。据悉,新车将将于2月上市,一季度开启交付,共三款车型
2025-02-05 17:12:00
中国联通首条自由空间光承载业务顺利开通:无需物理介质 跨湖高速传输
快科技2月5日消息,中国联通官方介绍,中国联通研究院联合江苏联通、蓝星光域对研发设备成果进行了现场验收,现场部署环境是跨湖1
2025-02-05 17:12:00
天钡GT37迷你主机首发5299元:锐龙AI 9 HX 370旗舰芯
快科技2月5日消息,天钡推出了新款迷你主机——天钡GT37,首发5299元。新款迷你主机采用硬朗的电竞外观,左右侧有斜切的通风开口
2025-02-05 17:12:00
国产科幻大片《流浪地球3》下月开机:网友喊话求加入我国6代战机
快科技2月5日消息,据国内媒体报道称,国产科幻大片《流浪地球3》将会在下月开机,预计2027年春节上映(此前官方已经宣布2027年大年初一上映)
2025-02-05 17:12:00
创史高 春节充电量最多的三条高速公路出炉:京沪高速排第3
快科技2月5日消息,据国家电网智慧车联网平台的最新数据显示,2025年春节期间,我国新能源汽车在高速公路上的充电量实现了大幅增长
2025-02-05 17:12:00
国货爆款:颐莲玻尿补水喷雾30元速囤(必入)
颐莲玻尿酸喷雾300ml日常售价89元,今日百亿补贴万人团买一送一,到手价为60元2瓶。一喷瞬补水,时刻水润充盈。3大维度补水
2025-02-05 17:12:00
布鲁可携多IP系列产品亮相德国纽伦堡玩具展,持续推进全球化战略布局
随着中国春节的钟声敲响,全球玩具行业的的目光将再次聚焦于欧洲的"玩具都城"——德国纽伦堡市。1月28日至2月1日,这里举办被称为是"世界三大玩具展"之一的纽伦堡玩具展
2025-02-05 17:14:00
刷手机真的会让“大脑腐化”吗?牛津大学教授反驳称研究不支持
近日,英国《卫报》刊发文章——《刷手机真的会让“大脑腐化”吗?》,令人耳目一新:多位神经科学家、心理学家的研究和观点认为
2025-02-05 17:15:00
华为引望申请5D蟹行商标
华为引望申请华尔兹掉头商标天眼查知识产权信息显示,近日,深圳引望智能技术有限公司申请注册“5D蟹行”“华尔兹掉头”商标
2025-02-05 17:17:00
浙江在线2月5日讯(通讯员 王蓉) 近日,南京银行杭州分行在支付业务管理工作领域传来喜讯,凭借在支付结算、移动支付等多方面的卓越表现
2025-02-05 17:25:00
欧戈雅刘凡立:家居的另一种可能
莫尔说:“为了寻找想要的东西,我们走遍了全世界。回到家找到了”。家,是一个有温度的词语。一间房子,里面装满了爱,生活就有了意义
2025-02-05 17:34:00