• 我的订阅
  • 头条热搜
谷歌发布gemma2大语言模型,共有两种大小
...布新闻稿,面向全球研究人员和开发人员发布Gemma2大语言模型,共有90亿参数(9B)和270亿参数(27B)两种大小。Gemma2大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。谷歌在新闻稿中表示...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...发展的道路上,科技巨头们曾经竞相开发规模庞大的语言模型,但如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,挑战着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型...……更多
定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了
...I超级计算机——Project Digits。有多强悍? 2000亿参数的大模型,直接在你办公桌上(自己的桌面系统)就能跑!如果把两台Project Digits一块“食用”,那么还可以跑4050亿参数的大模型。据了解,每个Project DIGITS配备了128GB统一、...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...0%的Triton内核Pytorch最近发表了一篇技术博客,他们以两个模型——Llama3-8B和IBM的Granite-8B Code为例,100%使用Triton内核实现了FP16推理。Granite-8B Code是由IBM开发的一种仅限解码器的代码模型,专为代码生成任务设计。仓库地址:……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...上一代WSE-2的两倍,可用于训练业内一些最大的人工智能模型。在近日的Hot Chips 2024大会上,Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示,WSE-3依然是采用了一整张12英寸晶圆来制作,基于台积电5nm制...……更多
碾压所有对手?谷歌发布轻量化开源大模型,笔记本电脑就可跑
开源大模型赛道迎来重磅新品。当地时间2月21日,谷歌宣布正式推出全新的开源大语言模型(LLM)“Gemma”, 旨在帮助开发人员和研究人员负责任地构建人工智能。据介绍,Gemma大模型与谷歌规模最大、能力最强的人工智能模型...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...MatX正在挑战英伟达在AI芯片领域的霸主地位,其为大语言模型训练而设计的AI芯片将于明年问世。这家公司的官网显示,使用MatX芯片,训练70B大模型的延迟将小于10ms/token。该公司还预言,使用其芯片训练,能够让世界上最好的...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:许多声称开源的AI模型,实际上在...……更多
英伟达发布mistral-nemoai大语言模型
...国初创公司MistralAI,今天发布了全新的Mistral-NeMoAI大语言模型,拥有120亿个参数,上下文窗口(AI模型一次能够处理的最大Token数量)为12.8万个token。VentureBeat与Midjourney合作制作Mistral-NeMoAI大模型主要面向企业环境,让企……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...试用推广、团队扩张。 一、Copilot平台推出Agent能力,小模型满足端侧需求在Scaling Laws下,AI技术的能力大约每六个月就会翻倍增长。陶然谈道,如何让技术成果对齐行业、企业的实际业务需求,加速技术能力的落地转化,成为...……更多
英伟达llama-3.1-minitron4bai模型发布
...,英伟达公司联合Meta公司发布了最新的Llama-3.1-Minitron4BAI模型,主要通过结构化权重剪枝、知识提炼等尖端技术,成功蒸馏(Distill)出40亿参数的“小而强”模型。图源:英伟达Llama-3.1-Minitron4B模型在Llama-3.1-Minitron8B基础上……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...合成高分辨率、高质量,且具有强文本-图像对其能力的模型。而且,它还能高效生成高达4096×4096像素的图像。项目主页:https://nvlabs.github.io/Sana/论文地址:https://arxiv.org/abs/2410.10629Sana的核心设计包含了以下几个要素:深……更多
英伟达发布80亿参数的ai模型
...伟达(NVIDIA)宣布,其已成功研发并发布了一款全新的AI模型,该模型拥有高达80亿的参数规模,具备精度高、计算效率高等优点,可在GPU加速的数据中心、云和工作站上运行。据介绍,这款新发布的AI模型是基于英伟达在深度学...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...)Blackwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外,黄仁勋还在GTC大会推出了新一款...……更多
...暂未回应。值得一提的是,此前许多外界人士认为 通过模型蒸馏技术,DeepSeek可能在训练过程中使用了 ChatGPT 等模型的输出数据作为训练材料,而这些数据中的「知识」被迁移到 DeepSeek 自己的模型中。事实上,这种做法在 AI 领...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%
...两款芯片还是互相兼容的。这意味着,使用H100训练/推理模型的企业,可以无缝更换成最新的H200。全世界的AI公司都陷入算力荒,英伟达的GPU已经千金难求。英伟达此前也表示,两年一发布的架构节奏将转变为一年一发布。 就...……更多
AI“卖铲人”英伟达,为何业绩再爆发?
...智能在2023迎来爆发,生成式AI以ChatGPT为代表掀起全球大模型浪潮,全球各行业的算力需求激增。英伟达GPU作为主流AI训练解决方案使其成为最大受益者,实现量价双收。英伟达财报也揭示了未来发展战略的三大方向:一是以数据...……更多
英伟达尖端图像处理半导体h200开始供货
...英伟达方面公布的性能评测结果,以Meta公司旗下大语言模型Llama2处理速度为例,H2000相比于H100,生成式AI导出答案的处理速度最高提高了45%。市场调研机构Omdia曾表示,2022年英伟达在AI半导体市场约占8成的份额,与此同时AMD等...……更多
微软难以摆脱英伟达 |焦点分析
...市场至少90%的份额。AI芯片是AI时代石油一般的存在。大模型公司想更快推出模型和AI应用,就必须大量购入英伟达的芯片。而英伟达的产能有限,按照上一年计划制定的供给,远不能满足蓬勃的市场需求,抢不到芯片的云厂商、...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定大型语言模型的速度快40%,在推理端比英伟达H100快50%。基辛格在现场...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
...伟达 9 月 23 日发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
程序员福音 英伟达推出AI编程新模型:代码生成、补全、调试样样精通!
程序员福音 英伟达推出AI编程新模型:代码生成、补全、调试样样精通!快科技2月29日消息,近日英伟达和Hugging Face、ServiceNow一起发布了StarCoder2模型,代码生成、补全、调试样样精通。据介绍,系列模型包括一个ServiceNow训练...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...最先进的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但...……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...上最大最快的巨型芯片Grace Blackwell NVLink72、首个世界基础模型Cosmos等,并公布了在AI代理、物理AI等方面的布局和进展。新一代GeForce RTX 50系列芯片,最高售价1999美元黄仁勋开场就开玩笑称“你们现在就在我们的数字孪生世界里...……更多
更多关于科技的资讯:
●杨炯上周末,在珠海的亚洲通航展上,奥捷龙航空科技有限公司格外引人注目。虽然已多次到珠海参展,但这次它“来自厦门”。这一全球市场份额第一的德国旋翼机品牌
2025-12-02 08:18:00
博物馆进入“沉浸时代”,感官残障观众如何“入场”
视障文化博物馆“触摸文明”展厅。中青报·中青网记者 李怡蒙/摄如今,许多博物馆将视觉、听觉、触觉等多种感知方式融合,创造出多层次
2025-12-02 05:43:00
烟台联通举办客服人员心理健康专题讲座
胶东在线12月1日讯为加强对一线客服员工的人文关怀,帮助员工有效应对工作压力,提升情绪管理与自我调适能力,11月26日
2025-12-02 06:42:00
摘要:本文分析现代物流网络布局与供应链弹性提升的内在关联,探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力
2025-12-02 07:09:00
摘要:本文聚焦管理会计在企业战略决策中的应用,首先解析其与战略决策的内在关联,即通过整合财务与非财务信息,为战略制定提供系统性支持
2025-12-02 07:10:00
中国网12月2日讯 据国家安全部官微消息,国家安全部提示,SDK(软件开发工具包)是一套为特定软件框架、硬件平台或操作系统提供的开发工具集合
2025-12-02 07:26:00
全球首创全动压空气轴承产业化成果发布,开启高端制造新纪元
北京讯—— 2025年11月28日,“全球首创全动压空气轴承产业化成果发布会”在北京首钢园香格里拉酒店圆满落幕。此次盛会标志着我国在超精密制造领域取得了重大突破
2025-12-02 07:32:00
联通超清电视狂欢双十一,临沂IPTV用户喜获iPhone17豪礼
鲁网12月1日讯一年一度的双十一购物狂欢盛宴圆满收官,在这场全民消费热潮中,山东联通精心策划的“双十一福利再升级”活动脱颖而出
2025-12-01 11:12:00
千里运荔藏巧思 现代加盟终端拓新局
“就算失败,我也想知道,自己倒在距离终点多远的地方。”电视剧《长安的荔枝》中这句掷地有声的台词,精准道出了当下创业者选择加盟之路时的执着与忐忑
2025-12-01 12:23:00
赛事总奖金160万元!WCI国际冠军赛苏州完美收官
2025年坦克世界国际冠军赛(WCI)11月30日在苏州阳澄国际电竞馆落下帷幕。来自中国、欧洲、北美和亚太地区的八支顶尖战队经过激烈角逐
2025-12-01 13:58:00
2025年北京市中小学生电子与信息创意实践活动圆满举行
当AI小球听懂指令,当智能车驰骋赛场,当电路在指尖点亮创意……孩子们像科学家一样思考,像工程师一样实践。11月30日,2025年北京市中小学生电子与信息创意实践活动在北京市第十四中学(畿辅校区)火热开幕
2025-12-01 14:26:00
烟台联通创新应用高压直流供电技术 破解高铁5G基站供电瓶颈
胶东在线12月1日讯在青烟威荣高铁5G覆盖扩容工程建设中,烟台联通成功应用高压直流供电技术创新方案,有效解决了牟平北山隧道西口
2025-12-02 05:00:00
海尔智慧家庭成立创新实验室布局好房子住居生态
海尔智慧家庭战略持续强化、开放和加速布局,又交出新成果。11 月 28日,以“AI 新纪元 共筑智慧家”为主题的海尔智慧家庭生态创新研讨会在北京召开
2025-12-01 14:51:00
海尔智慧家庭新成果:2025物联网大会斩获两项大奖
海尔智慧家庭持续强化、开放并加速智慧居住领域战略布局,如今再添重磅新成果。11 月 29 日,在首届全球万物智联数字经济可持续发展大会暨2025(第十届)世界物联网大会上
2025-12-01 14:51:00
海尔印尼冷柜工厂奠基将增百万产能
11月27日,海尔印尼冷柜工厂奠基。这座规划年产能100万台的冷柜工厂,将成为海尔智家本土化战略布局及数字化转型落地的又一里程碑
2025-12-01 14:53:00