• 我的订阅
  • 头条热搜
微软、英伟达纷纷押注小模型,大模型不香了?
...发展的道路上,科技巨头们曾经竞相开发规模庞大的语言模型,但如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,挑战着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型...……更多
微软难以摆脱英伟达 |焦点分析
...市场至少90%的份额。AI芯片是AI时代石油一般的存在。大模型公司想更快推出模型和AI应用,就必须大量购入英伟达的芯片。而英伟达的产能有限,按照上一年计划制定的供给,远不能满足蓬勃的市场需求,抢不到芯片的云厂商、...……更多
微软推出自研AI芯片:台积电5nm工艺、Open AI开启试用,想摆脱对英伟达依赖?
...能够带来终极效率、性能和规模。”对目前正在加速AI大模型服务布局的微软来说,自研芯片更多有着成本考虑,同时也能够避免过度依赖供应商,对其长期的商业化也将产生影响。 两款芯片均为5nm制程,OpenAI开启测试微软发...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
AI芯片下半场:英伟达不再一家独大
...开发者大会上,推出两款定制芯片,以应对不断增加的大模型训练成本挑战,并试图降低提供AI服务的成本。微软表示,新发布的芯片不会出售,仅供支持自己的产品,并作为微软云Azure云计算服务的一部分。微软最新推出的两...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...显存具备更大的容量和更高带宽,可以支持超大参数的大模型训练与推理。官方给出的参数显示,H200相较上一代产品在Llama2和ChatGPT的训练速度分别能提升40%和60%。 可以看出,从MI300X到H200,再到Maia100,大厂对训练参数量、训练...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...达的垄断地位。而AMD的MI300,在部署32K上下文窗口的GPT-4模型时,居然比H100效果更好?AI芯片大决战,即将来临!AI硬件开发商初创公司的未来会怎样?Tenstorrent CEO David Bennett直言不讳地表示,在我们这个行业,大部分初创公司的...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...新的石油。」图/ X(Twitter) 但算力依然受限,核心是大模型训练、推理都严重依赖于英伟达高端 GPU,而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底,还是算力不够用,「供给」赶不上...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...)Blackwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外,黄仁勋还在GTC大会推出了新一款...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
...100TensorCoreGPU,比上一代虚拟机性能更强大,可显著提升AI模型的训练和推理速度。同时,微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外,NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术,每个GPU……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
...算卡的算力还远远不够,尤其是像Sora这样的文生视频的模型出来,更是对计算卡的算力提出了更高的要求,于是英伟达也适时地推出了下一代GPU,在AI性能上有着突飞猛进的进步,可以说拉了竞争对手整整一代。英伟达在今天凌...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...AI能够做的工作有了更强烈的预期和紧迫感,而且各种大模型如雨后春笋一般地涌现出来,市场对于高性能芯片的需求度也爆棚了。黄仁勋推出B200的时候,人们忍不住要惊呼了。这是Hooper后的新一代架构,以数学家Blackwell命名。...……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...,1.5 倍的内存带宽以及 2 倍的网络带宽提升。同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。英特尔预计...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...MatX正在挑战英伟达在AI芯片领域的霸主地位,其为大语言模型训练而设计的AI芯片将于明年问世。这家公司的官网显示,使用MatX芯片,训练70B大模型的延迟将小于10ms/token。该公司还预言,使用其芯片训练,能够让世界上最好的...……更多
英伟达带来最强AI芯片,但赶超苹果又远了一步?
...25倍。叠加B200搭配的8颗HBM3e内存,最大可支持10万亿参数模型的训练。作为对比,OpenAI的GPT-3模型参数为1750亿,据黄仁勋透露,GPT-4模型参数约为1.8万亿。以训练一个1.8 万亿参数模型的GPT-4为例,之前需要用8000个Hopper GPU干的活儿...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
\\\
...图:英伟达AI产品更新路线图就性能的升级对比,H200在大模型Llama和GPT-3.5的输出速度分别是H100的1.9倍和1.6倍,在高性能计算方面的速度达到双核x86 CPU的110倍。而到了GB200,与H100相比,可以将LLM推理工作的性能提高30倍,并将成...……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...试用推广、团队扩张。 一、Copilot平台推出Agent能力,小模型满足端侧需求在Scaling Laws下,AI技术的能力大约每六个月就会翻倍增长。陶然谈道,如何让技术成果对齐行业、企业的实际业务需求,加速技术能力的落地转化,成为...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
最强大模型训练芯片H200发布!
...联技术,可以以最高性能运行各种应用负载,包括175B大模型的训练和推理。HGX板的独立性质使其能够插入合适的主机系统,从而允许使用者定制其高端服务器的非GPU部分。接下来是QuadGH200超算节点——它由4个GH200组成,而GH200是...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训
...标是实现最快的训练完成时间,计划本月晚些时候开始训模型。这将成为世界上最强的训练集群,优势不言而喻。我们决定自行建设10万块H100芯片系统,以及下一代主要系统的原因是,我们的核心竞争力取决于能否比其他AI公司...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...可用本地API的Copilot库WindowsCopilotLibrary,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PCCopilot+PC如何与AI应用程序(App)密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
文|尚恩编辑|邓咏仪封面来源|Figure“大模型”终于有实体了。美国时间3月13日,由OpenAI投资的机器人公司Figure发布了一段视频demo,视频里的机器人,不仅可以与人进行对话交互,理解人类的意图,而且还拥有记忆力。当工...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...求主要分为训练与推理两大阶段,训练可以理解为打磨大模型智能水平的过程,而推理则是在大模型应用过程中计算的过程。对于这两者的算力需求,一些机构提出了各自的估算方式,它们可以用一个公式来简单概况:每参数每...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...最先进的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但...……更多
“去英伟达化”加速!Meta、谷歌接连发布自研芯片,英伟达能否捍卫霸主地位?
...等外部芯片生产商的依赖,同时还允许公司根据自己的AI模型定制个性化的硬件。随着顶流AI工具ChatGPT的发布,生成式AI市场也引发了各大科技公司的竞相追逐,算力则是这一领域蓬勃发展背后的核心引擎。在这一背景下,作为...……更多
OpenAI计划研发自己的AI芯片,已有收购目标
...司首款专为人工智能设计的芯片。随着 ChatGPT 等大型语言模型(LLM)掀起新一轮 AI 变革浪潮,AI 芯片短缺问题日益严重。知情人士称,至少从去年开始,OpenAI 就讨论了各种方案来解决其所依赖的 AI 芯片的短缺问题,目前已经评...……更多
更多关于科技的资讯:
华为用户必看!换电池优惠50元、官方维修8.8折 错过等明年
快科技12月29日消息,距离2024年结束仅剩3天,华为服务回馈礼遇活动也将于12月31日正式收官,华为手机、平板等设备用户
2024-12-29 07:39:00
蔚来同步维权最新进展:多个账号被蔚来固定证据 已在多地法院起诉
快科技12月29日消息,蔚来汽车法务部日前发布消息称,和大家分享下公司近期依法维护自身权益的举措:“Super Wade”
2024-12-29 07:39:00
玉林迈入高铁时代 至南宁行程缩短至48分钟
快科技12月29日消息,近日,据官方获悉,南宁至珠海高铁南宁至玉林段(南玉段)将于12月30日开通运营,这标志着广西玉林迈入高铁时代
2024-12-29 08:09:00
SUV高速撞上隧道 发动机都被撞飞!司机:空调太暖 睡着了
快科技12月29日消息,公安部交通管理局今日分享了一起高速上疲劳驾车导致事故的案例。据介绍,12月18日凌晨4时许,浙江温丽高速向阳山隧道内
2024-12-29 08:09:00
京东何晓冬:AI大模型助力新质生产力 推动实体经济发展
本文转自:人民网京东集团副总裁、京东探索研究院院长何晓冬。人民网记者 翁奇羽摄人民网北京12月28日电 (记者王绍绍)在今日由人民网举办的“2024人民财经论坛”上
2024-12-29 08:22:00
女子半夜和男友吵架刷机票抢到3元票 平台:出票成功就能用
快科技12月29日消息,据报道,多位网友日前爆料称,自己抢到了海南航空明年1月4日从成都飞往北京的机票,票价3元,外加70元的机建燃油费
2024-12-29 08:39:00
量子AI+生物医药融合创新峰会在无锡滨湖举办
本文转自:人民网-江苏频道峰会现场。活动主办方供图。12月27日,量子AI+生物医药融合创新峰会在无锡滨湖区举办,峰会由图灵量子
2024-12-29 08:42:00
中国笔记本电脑最新销量出炉:联想销量销额双第一 AI PC立功
快科技12月29日消息,根据洛图科技发布的最新报告,2024年11月,中国大陆笔记本电脑线上公开零售市场的销量130万台
2024-12-29 09:09:00
韩国一客机发生坠落:机上载有181人 已有数十人死亡
快科技12月29日消息,据新华社报道,韩联社29日报道称,韩国务安机场飞机发生坠落,机上载有175名乘客,6名乘务人员
2024-12-29 09:09:00
“哪吒”航行器上天入海 创意奇思“落地生花”一批大学生创新创业成果亮相科交会,看似“不可能”的想法变成现实□南京日报/紫金山新闻记者 何洁“哪吒”不闹海了
2024-12-29 09:15:00
见“微”知著 敢为天下先
赵柏闻,1992年生,北京人。2004年起就读于人大附中,2008年进入中国农业科学院实习。2014年创立北京量化健康科技有限公司
2024-12-29 09:35:00
韩国载181人客机降落时撞击起火:全程被拍下 现场惨烈
12月29日消息,综合央视等报道,当地时间今日上午9时左右,一架韩国济州航空客机在韩国南部全罗南道务安国际机场降落过程中冲出跑道
2024-12-29 09:39:00
无人快递车撞上问界M9!车主:无人车跟碰瓷一样 减速后又加速撞了上了
快科技12月29日消息,据报道,杭州问界M9车主沈先生,在驾车出车位时,被后方驶来的一辆无人快递车撞上,交警判定沈先生主责
2024-12-29 10:09:00
AI教父辛顿发声:30年内AI致人类灭亡几率达10%-20%
快科技12月29日消息,2024年诺贝尔物理学奖得主、素有“AI教父”之称的辛顿(Geoffrey Hinton)表示
2024-12-29 10:09:00
2025年央视春晚主创团队官宣:于蕾任总导演
快科技12月29日消息,距离2025年除夕还有30天,中央广播电视总台《2025年春节联欢晚会》正在紧锣密鼓筹备中。今日
2024-12-29 10:09:00