• 我的订阅
  • 头条热搜
Arm CEO:DeepSeek低成本是谣言 会被封杀
...确实令人意外,但认为其训练成本仅560万美元的说法是“谣言”,并预计DeepSeek最终可能会遭到“封杀”。Rene Haas表示,承认 DeepSeek 是一个惊喜。“首先,从理论上讲,开源模型已经赶上了一些最好的闭源推理工具。”他进一步...……更多
OpenAI CEO承认了!DeepSeek非常棒 不会起诉
...型DeepSeek-R1,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20(仅用了2048 个 H800 GPU,花了两个月的时间训练完成,仅花费了约558万美元),API的定价更是只有后者的约1/28,相当于使用成本降低了约97%。也...……更多
AI大模型难“救”商汤:上半年亏损超31亿元,上线3万张GPU,成本大增再爆裁员
...点,智慧城市营收骤降60%虽然商汤营收微增,但期内销售成本却大幅增长近63%,达到7.84亿元;其中占比达82%的硬件成本及分包服务费同比增长54%,另外两块成本——AI数据中心(AIDC)运营和折旧摊销成本也均分别暴增75%、562%。...……更多
日本将迎来最强大AI超算!NVIDIA+软银联手打造
...AI与5G工作负载的新型电信网络,能助力运营商将基站从成本负担转变为AI创收资源。据NVIDIA与软银估算,电信运营商在新AI-RAN基础设施上每投入1美元资本支出,有望获得约5美元的AI推理收入。软银预计,考虑到运营成本和资本...……更多
人工智能接入电信网络意味着什么?英伟达称最早明年下半年商...
...一用途的基础设施转变为多用途的基础设施,并将站点从成本中心转变为收入来源。与传统的5G RAN系统相比,基于英伟达加速计算平台NVIDIA Aerial RAN的5G AI-RAN将减少40%的部署功耗(以瓦/Gbps为单位),电信运营商每次向AI-RAN基础...……更多
日本打造自己的“ChatGPT”
...资助创建一个针对科学需求的人工智能项目,该LLM的开发成本至少为300亿日元,预计将于2031年公开发布。超级计算机制造商NEC在5月份开始使用基于日语的生成式人工智能,并声称它将创建内部报告所需时间缩短了50%、将内部软...……更多
...马逊涉及多个不同领域的业务,采用A.I.技术将带来降低成本和提升客户体验的诸多机会。这一战略受到了投资者的欢迎,亚马逊在公布财务结果后股价上涨了约9%。该公司报告了11%的同比净销售额增长,主要得益于广告、订阅服...……更多
...是英伟达的H100芯片。相比之下,H100目前已经全面发货、成本更低,更重要的是,MI300系列不具备H100的Transformer引擎,在提高大模型训练性能方面有限。微软放弃智能助理Cortana,转而投向生成式AI 8月4日消息,微软将于8月关闭Cort...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...Mixtral-style结构的MoE模型。 至此,所谓停止预训练模型的谣言,也就不攻自破了。全链路领域增强工具链,覆盖模型部署全流程作为「1+3」产品矩阵中的「1」,从数据处理、增量预训练、模型微调、强化学习、提示词优化,到...……更多
丰田等多家日企禁用DeepSeek 理由是担忧安全
...并同步开源模型权重。DeepSeek-V3和DeepSeek-R1两款大模型,成本价格低廉,但性能与OpenAI相当,让美国硅谷也为之震惊。【本文结束】如需转载请务必注明出处:快科技责任编辑:若风文章内容举报 ……更多
高盛:DeepSeek崛起后 对冲基金暂停了对美国AI的押注
...了DeepSeek-V3模型,其开发时间据称仅用了两月时间,训练成本更是不到600万美元,远低于美国同行。DeepSeek上周又发布了推理模型DeepSeek-R1,该模型能力与AI龙头公司OpenAI的推理模型o1相当。DeepSeek引发了市场对AI开发成本,以及美...……更多
“日日新大模型”亮相奥运会,商汤科技AI应用成色几何?
...化、细分的长尾需求,而不是通用需求。这也导致其开发成本高、交付难度大,而且账款周期长,影响现金流。与此同时,因为需求过于长尾,按照客户需求研发出来的产品也将无法被其他客户与场景复用,影响其产品的标准化...……更多
腾讯、红杉、软银集体站队!这只苏州独角兽,年入已超1亿美元
...在苏州落地。“苏州有朋友在,同时IT资源充足,并具备成本优势,又面对广大的中国市场也是一个重要的考虑因素。“2009年,智慧芽第一代产品在苏州诞生,并顺利争取了首批订单和第一笔约500万的天使投资。红杉、顺为频频...……更多
GPT-4就是冲着赚钱来的!
...00个问题。ChatGPT Plus已经可以适用GPT-4了在前不久的GPT-4“谣言”阶段,微软就曾多次通过各种渠道透出New Bing会第一时间应用GPT-4。新模型发布后,微软更是在第一时间宣布“我们很高兴确认新的Bing正在运行GPT-4,我们已经为搜...……更多
没赶上大模型的投资人 不想错过具身智能
...人行业本身的技术突破还没有到,包括技术难度大,制造成本高昂以及商业化难度高仍是三座大山。机器人双足行走一直以来都是一个技术难点,两条腿如何平衡、去支撑这么大和重的一个身体,且和其他硬件结合控制,存在不...……更多
...求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自身的AI应用,AI普惠性有望增强。同时,其所应用的“测试时扩展”技术或代表一条更可持续的AI研发路径。低成本玩转高级推理美国斯坦福大学和华盛顿...……更多
...数,相比之下,GPT-3只有约1750亿个参数。为了保持合理的成本,OpenAI采用混合专家模型来进行构建。混合专家模型是一种神经网络,该系统根据数据进行分离训练多个模型,在各模型输出后,系统将这些模型整合输出为一个单独...……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...云通义千问(Qwen)模型进行监督微调。s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上,可谓依然是开源的胜利。作者 | 黄心怡今日一则关于人工智能领域的新闻引发广泛关注。据报道,李飞飞等斯坦福...……更多
GPT-4被破解 训练成本 模型架构的秘密都被挖出来了?
...关于GPT-4的技术信息,包括GPT-4的架构、参数数量、训练成本、训练数据集等。本篇涉及的GPT-4数据是由他们收集,并未公开数据源。仅供参考。原文翻译如下:揭秘GPT-4:导致OpenAI架构的工程权衡OpenAI 保持 GPT-4 架构的封闭性并...……更多
百度首次现场演示大模型微调过程,「文心一言」调用成本下降90% | 最前线
...办公软件“如流”上线了AI小助手。关于行业大模型训练成本,小助手给出的回答是“10万-50万卡时”。百度集团副总裁侯震宇表示,对客户而言,成本和模型性能才是评价大模型的两项指标。“训练一个大模型,动辄三个月,...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...模型谁更贵”时,忻舟表示,开源模型免费,给人一种低成本的印象,但大模型的应用并不仅仅是单一的技术,而是涵盖“技术+服务”的完整解决方案,企业要算“总账”。在业务实际落地时,开源模型若想达到与闭源模型相...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研究者使用最先进的方法,也需要在 8×H100 GPU 上训练一个多月的时间。此外,训练大模型...……更多
...误。 虽然地点不同,但接连两起利用恐慌情绪、借AI传播谣言的事件,造成了恶劣的影响。AI技术在解放生产力的同时,也在多个层面让谣言更“真实”、危害更大、治理更难。 首先,AI强化了谣言的欺骗性。根据传播学的认知...……更多
微软推出ZeRO++技术,可显著减少AI大模型训练时间和成本
...术,用于优化在训练大型AI模型时,容易遇到的数据传输成本和带宽限制的难题,可显著减少大模型训练时间和成本。据悉,ZeRO++建立在现有的ZeRO传输技术基础上,并提供增强的通信策略,可提高训练效率,同时减少训练时间和...……更多
OpenAI新年开出王炸,AI竞争升级
...生成60秒时长的精细视频,大大降低了视频制作的门槛和成本,特别是热点类等具备强烈时效性的内容。不过Sora更深层的意义在于,这也意味着有关AI的竞争再度升级。 2023年,ChatGPT的发布引领全球进入AI热潮,光是中国公司就...……更多
gpt-4模型架构泄露:包含1.8万亿参数、采用混合专家模型
...训练和推理的基础设施、参数量、训练数据集、token数、成本、混合专家模型(MixtureofExperts)等具体的参数和信息。▲图源 Semianalysis外媒表示,GPT-4在120层中总共包含了1.8万亿参数,而GPT-3只有约1750亿个参数。而为了保持合理的...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使用稀疏激活混合专...……更多
英伟达:CPU已落伍 用GPU训练大语言模型成本可降低96%
...公司宣称其 GPU 可以大幅降低训练大型语言模型(LLM)的成本和耗能。英伟达首席执行官黄仁勋在演讲中,向 CPU 行业发起了挑战,他认为生成式人工智能和加速计算是未来计算的方向。他宣布传统的摩尔定律已经过时,未来的...……更多
史上最大规模!OpenAI完成66亿美元融资:成万亿AI独角兽
...时刻决定退出,但并未影响OpenAI的融资进程。OpenAI的运营成本一直居高不下,包括约70亿美元的模型训练费用和ChatGPT的日常运营开支。不过ChatGPT依然保持着超过2.5亿的每周活跃用户,预计今年收入将达到37亿美元。如果OpenAI未能...……更多
...率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案...……更多
更多关于科技的资讯:
观赛有了更佳的趣味性与沉浸感金科院数字科技赋能国际赛艇大赛南报网讯(通讯员陆慧记者姜静实习生黄佳琪)2025南京·大学生国际赛艇公开赛近日在外秦淮河畔举行
2025-09-25 07:38:00
提升“双盲”模式下的评标质效雄安新区面向评标专家智能问答系统正式上线河北日报讯(见习记者康晓博)只需轻点鼠标,远在外地的评标专家就能获得精准指引
2025-09-25 07:58:00
大模型算出爆款,红枣变致富“金枣”
大模型算出爆款,红枣变致富“金枣”——看沧县红枣及干坚果食品加工产业如何实现数字化转型9月18日,河北华聚食品有限公司的工人忙着打包红枣产品
2025-09-25 07:59:00
9月17日,兴业银行信用卡中心与美团企业版在上海签署战略合作协议,共同打造“金融+生活”开放生态。根据协议,双方将基于开放共享
2025-09-24 07:24:00
金洽会上51个重点产业项目签约,计划投资802.21亿元——一串串数字,见证企业对南京的高度认可□南京日报/紫金山新闻记者张甜甜9月23日
2025-09-24 08:11:00
5项科技创新成果案例发布芯片设计迎“超强大脑”多癌早筛一管血“搞定”南报网讯(记者张安琪)9月23日,2025南京金洽会开幕式重点发布环节
2025-09-24 08:12:00
在今年国庆、中秋双节消费旺季来临之际,济南122站以“客户体验感”为核心,从“环境优化、商品管理、客户拓展”三大维度精准发力
2025-09-24 08:50:00
近期,光交换机行业催化剂不断。在中国国际光电博览会,OCS(光电路交换机)作为下一代交换技术的主流方向之一被重点展示。业内人士指出
2025-09-24 09:54:00
平安产险镇江中支助力“苏超”焦点战 贴心服务点亮球迷体验
9月20日,在“苏超”镇江队与无锡队激烈对决的赛场内外,平安产险镇江中支开展了系列品牌推广与球迷服务活动,不仅为现场近三万观众送去清凉与惊喜
2025-09-24 10:55:00
10大AI场景亮相!三翼鸟把“人工智能+”装进3000m²家
当前,人工智能正以前所未有的深度与广度融入千行百业。智能家居行业也迎来关键转折——从单点智能走向全屋智慧,从“人控制设备”升级为“家主动为人服务”
2025-09-24 10:59:00
海尔“懒人洗衣机”获近百万台海外订单
9月19日,海尔第九届人单合一模式引领论坛在北京举行。会上,海尔智家董事长兼总裁李华刚分享了海尔智慧家庭智能交互引擎的实践成果
2025-09-24 10:59:00
中移齐鲁创新院:九大成果入选“鼎新杯”典型案例
近日,2025数字化转型发展大会在北京举行。在大会应用征集评选活动中,中移齐鲁创新院共9项成果入选第四届“鼎新杯”数字化转型典型案例
2025-09-24 11:00:00
海尔泰国空调生产基地应用“无人物流+数字孪生”
在数字经济与实体经济深度融合的浪潮下,海尔智家再次以“数字化转型”的创新实践站上全球舞台。9月23日,海尔智家位于泰国春武里的空调生产基地正式投产
2025-09-24 11:00:00
以大模型重构记录边界,讯飞AI录音笔让每一段声音都被理解
近日,《关于深入实施“人工智能+”行动的意见》(下称《意见》)正式发布,明确提出到2027年,实现人工智能与6大重点领域广泛深度融合
2025-09-24 11:22:00
京东超市宣布:三年内扶持100家个护行业新锐品牌 每年打造百款爆品和百大商家店铺
9月23日,2025京东超市个护行业发展大会在北京举行,全国近400家知名个护品牌高管参会,共同探讨行业新趋势、新机遇
2025-09-24 11:37:00