• 我的订阅
  • 头条热搜
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能,而增加深度思考的计算能力则能让答案更精准,与一次性推理相比,长时间思考的推理AI可能需要每个任务多100倍的计算量。“具身智能(agentic AI)和物...……更多
英伟达推出全新文生图ai模型
...昨日(7月29日)发布声明,联合推出安全的商业文生图AI模型,能够在6秒时间内生成4张照片,比以前的模型性能提高了一倍,速度处于行业领先水平。图源:英伟达GettyImages表示全新文生图AI模型部分基于英伟达Edify模型架构,...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
芯片集群「贵」出天际,10年内单个集群价值将达万亿美元
...接赋予正确的权重。这些权重以矩阵的形式存储,而训练模型则需要使用数学方法对这些矩阵进行操作。单层神经网络的本质是矩阵相乘,两个按行和列排列的数字矩阵集合被用来生成第三个这样的集合,第三个集合中的每个数...……更多
英伟达带来最强AI芯片,但赶超苹果又远了一步?
...25倍。叠加B200搭配的8颗HBM3e内存,最大可支持10万亿参数模型的训练。作为对比,OpenAI的GPT-3模型参数为1750亿,据黄仁勋透露,GPT-4模型参数约为1.8万亿。以训练一个1.8 万亿参数模型的GPT-4为例,之前需要用8000个Hopper GPU干的活儿...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
...儿。1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
谷歌也来卷「小」模型了,一出手就是王炸,胜过了比自己参数多得多的GPT-3.5、Mixtral竞品模型。今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最...……更多
英伟达市值超越俄罗斯GDP,相当于全球GDP第12位丨看天下
...,成为美股第三、全球第四大公司。这背后,得益于AI大模型以及Sora的强势增长。在ChatGPT于2022年10月底诞生之前,英伟达的股价跌到了108美元。2022年11月,ChatGPT横空出世,作为一种应用在对话场景的大语言模型,它可以回答问...……更多
硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?
5月以来,国内大模型打响了“价格战”。从每百万个Token只要1块钱,到只要8毛钱、5毛钱……国内大厂如字节跳动、百度、智谱AI、科大讯飞等不断接力,有厂商甚至直接打出了“免费”的口号,震惊整个科技圈子。实际上,硅...……更多
自研芯片三国杀,头部智驾新战场,蔚小理谁强?
...种不同路径; 为什么一代FSD算力不大,却能跑端到端大模型; 蔚来神玑一颗顶四颗,到底是多少算力? 1颗小鹏图灵芯片,相当于3颗OrinX。 01 新势力为什么执着自研智驾芯片? 最直接的原因是成本。以市场上高阶智驾车型普...……更多
英伟达股东大会:黄仁勋3420万美元薪酬投票通过 汽车领域潜力巨大
...,过去编写软件程序来执行明确的指令,现在通过大语言模型表达意图。计算机现在是以意图为驱动而不是以指令为驱动。4. 黄仁勋指出,医疗保健、汽车和数字制造是英伟达所服务的最大的垂直行业,具有最大的潜力。5. 黄仁...……更多
...50亿个晶体管,基于台积电5纳米工艺打造,并专为大语言模型设计。而AzureCobalt100则是一款基于Arm架构的128核CPU,适用于执行常规计算任务,如为微软Teams提供动力。微软解释称,Maia将为生成式人工智能工作负载运行基于云的训...……更多
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
【新智元导读】适逢Llama 3.1模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型或RAG系统的微调生成合成数据。Epoch AI上个月刚刚发文,结果。真实数据稀缺可能不再是问题...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...理。国内新闻字节跳动被曝秘密利用OpenAI技术打造自家大模型,字节跳动回应OpenAI封禁账户:正与OpenAI联系沟通据外媒报道,字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型。在人工智能领域,这一做法通常被视为一种...……更多
AI公司是真饿了 开始砸钱买你拍的废片
...的废片?原因很简单: 视频数据不够用了 。生成式视频模型、自动驾驶系统甚至机器人训练,都需要大量的视频作为训练数据。而优质视频不仅创作门槛高,在 AI 时代的版权划分也很模糊。广告、电影公司的版权价格昂贵,网...……更多
英伟达官宣AI NPC首秀 相中了这款中国电竞游戏
...国际游戏展(Gamescom 2024)上发布了首款设备端小型语言模型(SLM),可用于提升游戏角色对话能力。英伟达还宣布,首款展示“NVIDIA ACE”数字人技术的游戏是Amazing Seasun Games(西山居)开发的《Mecha BREAK》(解限机) ,新技术...……更多
微软推出自研AI芯片:台积电5nm工艺、Open AI开启试用,想摆脱对英伟达依赖?
...能够带来终极效率、性能和规模。”对目前正在加速AI大模型服务布局的微软来说,自研芯片更多有着成本考虑,同时也能够避免过度依赖供应商,对其长期的商业化也将产生影响。 两款芯片均为5nm制程,OpenAI开启测试微软发...……更多
热点解读:英伟达GTC要点梳理,关注算力、机器人及游戏投资机遇
...强了大规模 AI 算力集群的算力,从而全面提升对于 AI 大模型的加速效果,将为应用端提供更加坚实的硬件基础。从应用端来看,英伟达的芯片正在深入气候、医疗、自动驾驶、机器人、工业工程、软件等领域。借助 AI 计算以及...……更多
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞
【新智元导读】RNN模型在长上下文中表现不佳?近日,来自清华的研究团队对此进行了深入的实验分析,结果表明:不是RNN的锅。与Transformer相比,RNN模型的一大优势是应对长序列的能力。比如Mamba,内部状态大小始终保持不变...……更多
寒武纪:公司产品对大模型有相应优化和设计 【寒武纪:公司产品对大模型有相应优化和设计】《科创板日报》18日讯,针对美国出口管制新规,《科创板日报》记者以投资者身份从寒武纪董秘办获悉,公司正在对新规进行更...……更多
不止卷硬件!理想新一代VLA智驾大模型有望下半年落地
...,理想汽车正在研发下一代VLA(视觉-语言-动作)智驾大模型,目标是于今年下半年实现项目落地。理想汽车在去年二季度财报电话会议上表示已启动端到端VLA模型的研究,将两个模型合二为一,使多模态大模型内化为端到端智...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
Meta大模型LLaMA 3即将登场,参数量或达1400亿
在推出开源大模型LLaMA2近一年之后,Meta的新一代大模型LLaMA3即将面世。在4月9日伦敦举行的一次活动中,Meta确认计划在下个月内首次发布LLaMA3。据了解,该模型将有多个具有不同功能的版本。但Meta并没有披露LLaMA3的参数规模。...……更多
本周(4.8-4.14)AI界发生了什么?
...时间4月9日,谷歌、OpenAl、Mistral在24小时内,接连发布大模型重磅更新。谷歌正式发布了Gemini 1.5 Pro的多项更新,包括企业AI平台预览版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。 OpenAl则又一...……更多
李彦宏断言有点早 开源大模型不弱鸡
...022年11月ChatGPT问世,这一现象级产品迅速点燃了市场的大模型热情。新老科技企业纷纷杀入,誓要抓住移动互联网以来最大的一次产业红利。当行业如火如荼发展一门心思搞技术之时,又出现了“路线之争”:闭源路线:以国外...……更多
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足
...无相关回应。仍可以在国内销售的AMD MI 210则被认为在大模型微调阶段具有相当竞争力。“最近算力涨价太多,我们确实感到很吃力。”一家大模型创业公司人士告诉《IT时报》记者,他们迫切希望有Plan B方案。最好的Plan B当然是...……更多
...)的方法,并通过一系列技术策略,最大程度地优化了大模型推理系统,实现了惊人的性能和效率。具体而言,在更大的吞吐的方面,大规模跨节点专家并行能够使得batch size(批尺寸)大大增加,从而提高GPU矩阵乘法的效率,...……更多
智驾 英伟达“急了”
...。这一变化也反映出AI巨头英伟达的最新策略——乘着大模型端到端的东风,在智驾领域和机器人分别发起“追击战”和“攻坚战”,再次尝试将自己的影响力通过数字世界覆盖现实世界。“停滞”的硬件,英伟达不再绝对领先...……更多
更多关于财经的资讯:
双首单科创债成功发行 青岛银行科技金融赋能民企创新突破
11月27日,由青岛银行独立主承销的“25临工重机PPN001(科创债)”顺利完成发行,标志着山东省首单首次注册民营企业科创债
2025-12-02 14:25:00
万达电影成立意马当先影视传媒公司
近日,北京意马当先影视传媒有限公司成立,法定代表人为沈晨,经营范围包含:电视剧发行;广播电视节目制作经营;电影发行;电视剧制作;电影制片;电影摄制服务等。企查查股权穿透显示,该公
2025-12-02 14:48:00
中国资源循环集团等在江苏新设城市更新公司
近日,中资环新源城市更新(江苏)有限公司成立,法定代表人为李九辰,注册资本9000万人民币,经营范围包括建设工程施工、建设工程勘察
2025-12-02 14:48:00
万润科技等在湖南成立智慧能源新公司
近日,湖南万润湘设智慧能源有限公司成立,经营范围包含:热力生产和供应;供冷服务;合同能源管理。企查查股权穿透显示,该公司由万润科技(002654)全资子公司深圳万润新能源有限公司
2025-12-02 14:48:00
宇树科技双足机器人专利获授权,可用于教育娱乐等领域
近日,杭州宇树科技股份有限公司“双足机器人”专利获授权。企查查专利摘要显示,本外观设计产品用途用于巡检、安防、搬运、教育、娱乐、服务、工业作业或勘察等机器人,其设计要点在于形状。
2025-12-02 14:48:00
兴业银行发行50亿元绿色金融债券 首期票面利率为1.81%
12月1日,兴业银行发布公告称,经中国人民银行批准,兴业银行于2025年12月1日在全国银行间债券市场成功发行了该公司2025年第三期绿色金融债券
2025-12-02 14:49:00
农行200亿元第三期总损失吸收能力非资本债(债券通)落地
12月1日,中国农业银行股份有限公司(以下简称“农业银行”)公告称,其2025年总损失吸收能力非资本债券(第三期)(债券通)已发行完毕
2025-12-02 14:51:00
泽州浦发村镇银行获批解散 浦发银行承接其全部资产、负债等
12月2日,国家金融监督管理总局山西监管局发布关于泽州浦发村镇银行股份有限公司解散的批复,同意解散泽州浦发村镇银行股份有限公司,该行全部资产、负债、业务、网点、人员及其他权利义务
2025-12-02 14:52:00
周梦晨获批担任元亨泰富保险经纪江西分公司主要负责人
12月2日,江西金融监管局发布关于周梦晨元亨泰富保险经纪(宁波)有限公司江西分公司主要负责人任职资格的批复,核准周梦晨元亨泰富保险经纪(宁波)有限公司江西分公司主要负责人的任职资
2025-12-02 15:42:00
广州农商银行122.5亿元重大资产出售完成 剩余款项分9期收回
11月29日,广州农村商业银行股份有限公司(股份代号:1551,以下简称“广州农商银行”)正式完成一项非常重大资产出售事项
2025-12-02 15:50:00
山西银行:董事会同意聘任邢毅为行长
12月1日,山西银行官网发布行长变更公告,披露该行管理层人事调整事宜。根据公告,经山西银行第一届董事会2025年第二次临时会议审议通过
2025-12-02 16:04:00
技术解码宜美全光谱灯具:我们如何重新定义“好光线”?
当“长时间用眼”成为现代人的生活常态,灯光质量的重要性已不言而喻。我们或许都曾经历过在灯光下阅读不久便眼干涩、颜色失真的困扰
2025-12-02 16:27:00
中行德州分行成功落地资本项目收入境内人民币线上汇划业务
鲁网12月2日讯(记者 吴美琳 通讯员 王汉源)为贯彻落实《中国人民银行国家外汇管理局关于提升银行办理资本项目业务数字化服务水平的通知》相关要求
2025-12-02 16:51:00
第三届济南科技金融论坛:贯通资本市场枢纽,驱动科技产业循环
鲁网12月2日讯在国家将“科技金融”置于金融“五篇大文章”首位,并明确要求“构建同科技创新相适应的科技金融体制”的背景下
2025-12-02 16:51:00
3分钟急速封板!开开实业“借壳”传言不实!
今日尾盘,开开实业(600272)股价突然异动拉升,仅用不到3分钟时间就冲上涨停板,最终收报16.73元/股。当日,股吧中有多名用户发帖称
2025-12-02 17:12:00