• 我的订阅
  • 头条热搜
NVIDIA RTX显卡AI推理提速5倍!
...理性能可以跑到每秒319tokens,相比其他后端的每秒61tokens提速足足4.2倍。RTX4090则可以从每秒tokens加速到每秒829tokens,提升幅度达2.8倍。基于强大的硬件性能、丰富的开发生态、广阔的应用场景,NVIDIARTX正成为本地端侧AI不可或缺...……更多
面壁智能的端侧大模型面壁MiniCPM正式亮相
...大的底层支撑,先是算力方面,凭借全流程高效infra10倍推理加速,能够将成本降低90%;其次在算法方面,面壁模型通过高效模型训练配置实现模型能力快速形成;数据处理方面,凭借现代化数据工厂形成从数据治理到多维评测...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多
微软研究院推出orca2llm
...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型,在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多
AI芯片下半场:英伟达不再一家独大
...)”的新AI芯片组,目的是为ChatGPT等大语言模型的训练及推理提供英伟达芯片之外的替代方案。另据Tom’s Hardware消息,Athena使用的是台积电5nm工艺,专为大语言模型训练设计。 曾有知情人士透露,在开发Athena期间,微软为了满...……更多
intelarca770升级改进ai大模型
IntelArc锐炫虽然初入独立显卡市场,但表现可圈可点,尤其是随着驱动的不断优化,各方面性能都在持续突飞猛进,包括游戏,包括AI。比如最高端的ArcA770,不但集成XMXAI加速功能,还拥有16GBGDDR6大容量显存,非常适合做生成式A...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...可以加快数据处理速度,尤其是在语音和图像识别方面。提速的关键,自然是算力。为了提升算力,微软也是下了血本:采用台积电的5nm制程工艺,晶体管数量达到1050亿个。和今年4月被曝光的信息相比,Maia的制程工艺、设计架...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,...……更多
PC迎来AI时刻,英特尔、微软、联想等纷纷布局,产品价格将迎上涨
...算力是上一代的8倍,可在PC上实现高能效的AI加速和本地推理,并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步,上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU,算力为16TOPS,AI性能相比上一代提升...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...,因此它们一直被诟病生成的回答是基于概率,而非基于推理。这也就意味着,在当前的AI热潮中,这些模型架构可能无法幸存下来。毕竟,由于发展速度太快,如今的LLM寿命相对较短。昨天还炙手可热的模型,一两周后可能就...……更多
...比上一代虚拟机性能更强大,可显著提升AI模型的训练和推理速度。同时,微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外,NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术,每个GPU可提供400Gb/s的带...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...布的大模型Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。谷歌官方称“这是Bard自推出以来最大的升级”。Gemini Nano被称为“端侧任务最高效的模型”,Android开发者可以通过AICore来使用。据悉AICore是Android 14 ...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图像类型。特点:旨在提供一个全面、多样、复杂的视觉数学推理挑战...……更多
微软:从“软件老大”到“AI帝国”
...Bing、GitHub Copilot 和 ChatGPT 等 AI 工作负载运行云端训练和推理。这款芯片采用了 5 纳米工艺制造,拥有 1050 亿个晶体管。 Azure Maia 100 美颜照|Microsoft微软自己的DPU——Azure Boost也已全面上市。微软在今年早些时候……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...ckwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外,黄仁勋还在GTC大会推出了新一款服务...……更多
微软难以摆脱英伟达 |焦点分析
...在其科技大会上发布了两款自研芯片——用于云端训练和推理的AI芯片Azure Maia 100,和CPU(中央处理器)Azure Cobalt 100,分别在AI芯片和CPU芯片上正面对刚英伟达和英特尔。2023年3月ChatGPT火热后,英伟达的AI芯片A100、H100便一卡难求...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...率基础上,并通过改进视觉指令数据集和SGLang,提升了“推理、OCR等方面的性能”,意味着人类向AGI(通用人工智能)探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文 二、更适合中国人体质的GPT-4V...……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。英特尔预计,Gaudi 3将于2024年第二季度起出货,戴尔、惠普、联想、超微电脑等...……更多
...,Maia将为生成式人工智能工作负载运行基于云的训练和推理,并且它拥有大量的晶体管。而Cobalt将会被用于执行复杂、高性能的操作。微软表示,他们并没有计划对外销售这两款产品,而是更倾向于仅供内部使用。值得一提的...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
英伟达带来最强AI芯片,但赶超苹果又远了一步?
...结合,就能搭建为GB200超级芯片,其可以为大语言模型的推理环节提升30倍的工作效率。在具有1750亿个参数的GPT-3 LLM基准测试中,GB200的性能是H100的7倍,训练速度则是H100的4倍。值得一提的是,Blackwell并非某一款芯片的专属名,...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...1.0亮点主要包括五个方面:最先进的性能测试结果,新的推理以及创意功能,性能强大且高效的 AI 超算系统,责任与安全,以及可用性。首先,性能测试方面,在32个性能基准测试中的30个中,Gemini Ultra模型超越了现有最先进的G...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...flops的FP4计算能力,这是由其2080亿个晶体管提供的。高效推理:当与Grace CPU结合形成GB200超级芯片时,它能在LLM推理工作负载上提供比单个GPU高出30倍的性能,同时在成本和能源消耗上比H100 GPU高出25倍。训练能力:使用Blackwell GPU...……更多
财报大涨,股价微跌,英伟达放不下中国市场|焦点分析
...席卷全球,大模型、推荐引擎和生成AI应用程序的训练及推理需求非常强盛。无论是百川智能、智源等大模型厂商,还是阿里云、百度云等云服务厂商(CSP),甚至需要训练AI应用的企业,都对英伟达的产品有着较强需求。英伟...……更多
微软推出自研AI芯片:台积电5nm工艺、Open AI开启试用,想摆脱对英伟达依赖?
...发布的首款AI芯片命名为Maia 100,是一款用于云端训练和推理的AI加速器芯片。这款芯片采用台积电5nm制程,晶体管数量达到1050亿个,1600-3200TFLOPS的算力、4.8Tbps的网络IO等超过了英伟达H100和AMD MI300X,但在宽带等指标上有所落后。...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...发布了一个仅有27亿参数的小型模型Phi-2,它在多数常识推理、语言理解、数学和编码任务上超越了其他大型模型。尽管Phi-2的参数数量较少,但它在复杂的基准测试中展示了出色的性能,甚至超越了参数数量是其25倍的模型。微...……更多
AI电脑大潮来了!创盈芯AI迷你主机F1A正式面世
...的神经网络处理器(NPU),可以非常高效地持续执行一些AI推理任务负载,包括语音交互、图像识别以及人脸识别等场景,以便用户可以在一个设备上完成各种创意工作。此外,NPU AI引擎的加持,让F1A在响应速度上提高了35% ,而能...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源:官方视频谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言...……更多
AIGC风潮席卷手机:但在PC面前 还是个弟弟
...全新的NPUAI独立引擎。它通过单独设置的神经计算引擎、推理流水线,彻底接手端侧的AI推理负载,其中MAC阵列可以高效执行矩阵算法和卷积运算,每周期效率多达2048。这样的性能更是手机端望尘莫及的,速度超快的同时功耗更...……更多
更多关于科技的资讯:
经营能力数字化,天联实业借力G7易流为危化物流赋能
董彦昌,河北天联实业的董事长,一直渴望一个系统能将运输的全链条——从接单到交货,再到应收账款结算——清晰展现。G7易流
2024-06-29 10:55:00
长广溪智造车规级高速协作机器人,撬动汽车行业万亿市场!
【摘要】:车规级“工控+工艺”智造,席卷汽车圈! 当前,协作机器人行业产品同质化竞争趋势显著,除了协作机器人厂家“十八般武艺”同台竞技以外
2024-06-29 15:45:00
政企协同创新发展!山东省标准化研究院调研组到鲁南制药调研
6月25日,山东省标准化研究院调研组到鲁南制药集团调研。与会人员现场参观了互联网大事业群电商中心、首荟商城、IT研发中心
2024-06-29 16:18:00
能源站球形软接:技术解析与使用者对话
背景介绍随着能源行业的发展,能源站在保障能源供应中扮演着越来越重要的角色。在能源站的运行过程中,球形软接作为一种重要的连接组件
2024-06-29 16:43:00
船舶压载水处理系统挠性接头:技术与应用的对话
背景引入在船舶的航行过程中,压载水系统对于维持船舶的稳定性和安全性起着至关重要的作用。而压载水处理系统中的挠性接头,作为连接管路的关键组件
2024-06-29 16:46:00
压载水系统挠性接头:终端使用者与技术人员的对话
背景介绍在船舶、海洋工程等领域,压载水系统扮演着至关重要的角色。压载水系统挠性接头作为系统中的关键组件,其性能直接影响到整个系统的稳定性和安全性
2024-06-29 16:48:00
耐火性能试验中挠性接管,探讨关键点
背景介绍:随着工业技术的不断发展,高温、高压等极端工况下的设备安全运行越来越受到重视。挠性接管作为一种重要的连接元件,其耐火性能直接影响到整个系统的安全性和稳定性
2024-06-29 16:53:00
库克宣布Apple Vision Pro正式上市
2024年进入下半场,科技圈最受瞩目的当属苹果公司的WWDC24。这一场硬核科技盛会因AppleIntelligence的登场而引发广泛的讨论
2024-06-29 16:54:00
100万个巴黎奥运会官方手环订单、10万件球迷服……距离2024法国巴黎奥运会开幕已不足30天,一批批由温商企业制作的手环
2024-06-29 12:02:00
Q1中国大陆云服务市场排名:阿里云37%份额遥遥领先 华为云腾讯云前三
快科技6月29日消息, Canalys最新数据显示,2024年第一季度,中国大陆的云基础服务支出同比增长20%,达92亿美元
2024-06-29 12:10:00
俄罗斯要将离婚手续费提高近7倍:以降低离婚率
近期,俄罗斯财政部的一份提案在社会各界引起了轩然大波。这份提案建议大幅增加多项国家行政事业性收费,其中最引人注目的莫过于将离婚登记手续费用从目前的650卢布(约合55元人民币)一举提高至5000卢布(约合425元人民币)
2024-06-29 12:10:00
胜利石油工程公司井下作业公司:引领夺油上产的先锋力量!
大众网记者 张艳秋 通讯员 丁剑北 顾珍时 李佳 李晶忠 东营报道在丰页12号井台180m³自动供砂装置前,原本需要7-8人施工的供砂区域
2024-06-29 12:36:00
高质量发展有温度!新华医疗口腔技术厂宽、深、温冲刺“双过半”的协同之路
大众网记者 郑明娜 通讯员 黄芬 淄博报道2024年,中国医疗器械行业市场竞争持续加强,高质量发展已成为企业生存与繁荣的关键所在
2024-06-29 12:36:00
国内首款MPSUV发布!零跑C16只要理想一半价格 想买MPV和SUV的人看完都沉默了
快科技6月29日消息,昨晚零跑C16正式上市,新车推出6款车型,分为增程和纯电两种版本,售价区间为纯电版16.18-18
2024-06-29 12:40:00
焕新归来!31岁“老商场”重出江湖 老品牌注入新活力 扫码阅读手机版
位于和平区滨江道商圈的吉利大厦29日全新亮相。这个承载了无数天津人情怀和回忆的商场备受关注,记者提前探店,看看重出江湖的31岁“老牌明星”将呈现哪些新意
2024-06-29 12:45:00