推理,模型,成本,参数,模型,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

火山引擎ai大模型赋能千行百业成趋势

...片。大的使用量，才能打磨出好模型，也能大幅降低模型推理的单位成本。豆包主力模型在企业市场的定价只有0.0008元/千Tokens，0.8厘就能处理1500多个汉字，比行业便宜99.3%。谭待表示，超低定价来自于用技术优化成本的信心，...……更多

2024-05-17 11:56:00火山,百业,模型,趋势,引擎,模型

不仅开源还便宜好用，硅谷员工直呼“火烧屁股”的DeepS..

...20日，量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生...……更多

2025-01-26 18:47:00好用,硅谷,屁股,员工,模型,美国

冯骥吹爆国产AI大模型DeepSeek:太强了 6到不真实!

...列出了AI大模型的六项关键突破方向：1、强大。比肩O1的推理能力，暂时没有之一2、便宜。参数少，训练开销与使用费用小了一个数量级3、开源。任何人均可自行下载与部署，提供论文详细说明训练步骤与窍门，甚至提供了可...……更多

2025-01-27 08:32:00太强,模型,国产,模型,网易,中国

AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带

...：「算力这块，你可以用别的芯片，但是这些芯片用来做推理还 OK，做训练的话还要等几年的样子，英伟达还是处在一个垄断的地位。」但基于实证的对比研究却往往又会给出不一样的答案，比如在同一个演讲中，李沐还提到了...……更多

2024-09-05 09:49:00英伟,模型,英伟,内存,推理,性能

所谓AI革命，到现在为止，是能源的一场“灾难”

...电量为1gwh。按一户普通人家一年用电1000kwh算，每天模型推理耗能相当于1000户人家一年的用电量；若按年计算，OpenAI消耗的能源在90-200gwh左右，相当于三峡大坝一年发电量（按一年发电1000亿千瓦时计算）的0.2%，发电侧使用的水...……更多

2024-07-10 11:56:00灾难,革命,能源,能源,模型,人工智能

有了它，断网也能“纵享丝滑”

...成一个固定的生态和框架，现在所看到的这些所谓开源和推理，都还没有统一的集大成者出现。● 端侧AI的需求是由应用驱动的，选择云还是端侧AI，主要取决于用户的选择，比如交通领域，需要做一些人流分析，包括人脸识别...……更多

2024-01-03 22:00:00云端,模型,场景,能力,成本,芯片

面壁智能的端侧大模型面壁MiniCPM正式亮相

...大的底层支撑，先是算力方面，凭借全流程高效infra10倍推理加速，能够将成本降低90%；其次在算法方面，面壁模型通过高效模型训练配置实现模型能力快速形成；数据处理方面，凭借现代化数据工厂形成从数据治理到多维评测...……更多

2024-02-01 21:36:00模型,智能,模型,智能,用户,数据

新一批南京大模型通过国家备案

...火X1全新升级，作为业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1，在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果提升，在模型参数比业界同类模型小一个数量级的情况下，整...……更多

2025-05-23 07:03:00南京,模型,国家,模型,南京,智能

山东移动：坚持科创引领，乘“数”而上焕新能

...层MaaS服务能力，提供算力接入、数据管理、大模型训练推理、智能体开发等多项服务。通过汇聚融合业界主流开源、商用模型能力，形成“1个九天大模型+X个商业大模型+N个开源大模型”的生态汇聚，提供开箱即用的大模型训推...……更多

2025-02-21 23:14:00科创,山东,移动,山东,模型,智能

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。会上，百度发布了文心大模型4.0的工具版，该工具版可以让开发者体验代码解释器功能，开发者不仅可以通过自然语言...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...本质的不同。其不仅进入到复杂的领域，还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

李彦宏：持续投入训练下一代大模型确保处于AI最前沿

...中，每18个月，性能就会翻倍，价格减半；如今，大模型推理成本每年能降低90%以上。”在李彦宏看来，回顾过去几百年历史，创新的本质是成本下降与生产力提升，在AI、IT乃至更多领域，大多数创新都与降低成本有关，如成本...……更多

2025-02-11 20:48:00李彦,下一代,模型,投入,训练,李彦

火山引擎丢出视频大模型「王炸」，云厂商从「价格战」回归「卷性

...始人闫俊杰向极客公园表示，从技术发展的角度看，模型推理成本 10 倍、百倍的降低是必然，只是时间问题，难的是通用模型的性能提升。在看到从 ChatGPT 到 GPT-4，性能出现了大幅提升时，大模型领域也沿着 OpenAI 在模型预训练...……更多

2024-09-26 13:33:00价格战,火山,模型,性能,厂商,引擎

清华UCSD提出全新微调方法，8B小模型媲美GPT-4o！科

...学问题时，通常会先评估问题的复杂性，再决定使用基本推理或专业工具。正是受这种解决问题流程的启发，一支来自UCSD和清华的研究团队提出了一种全新的微调方法，让模型「边适应边学习」，学会在使用外部科学工具和依...……更多

2024-12-03 13:34:00正确率,清华,模型,全新,科学,方法

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改

...05B开源巨兽Llama 3.1最近正式上线，既可用于批处理和在线推理，也可以作为基座模型，进行特定领域的专门预训练或微调。尤其是考虑到Llama 3.1有如此大的参数规模，加上丰富的15.6T token训练数据，非常适合用于数据生成。这篇...……更多

2024-07-30 09:38:00手把,英伟,最新技术,模型,代码,数据

AI难盈利，商汤生成式AI创收12亿增长两倍，全年净利亏损6

...最大的增长亮点。源于市场对生成式AI模型训练、微调和推理的需求爆发性增长。该业务主要面向手机、汽车等端侧AI和2B场景。商汤称，在新的业务板块下，生成式AI业务是重点发展方向，而传统AI的核心目标是提高现金流质量...……更多

2024-03-27 15:00:00商汤,净利,亏损,全年,盈利,生成

全球首个！中国电信完成千卡、千亿参数模型500公里联合训练试

...、北京电信成功了完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回，实现了500公里长距互联分布式训练，而且训练性能达到单数据中心...……更多

2025-01-23 13:32:00中国电信,中国,商用,模型,训练,参数

扩散模型=进化算法！生物学大佬用数学揭示本质

...在做同样的事情，顺着这条路，我们可以继续思考：模型推理是有限的，而真正的进化可能是无限且开放式的，如何使Diffusion Evolution适应开放式环境？其他版本的扩散模型会衍生出新的进化算法吗？扩散模型中的归纳偏差可以...……更多

2024-11-25 09:56:00大佬,生物学,算法,进化,模型,本质

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成文本，那...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

数据“坐高铁”，2000公里无损直达

...形成协同联动，可满足大模型训练高通量网络、AI智能体推理高弹性网络、数据要素流通高速承载网、工业控制高可用网络、政务专网高可靠网络等关键领域对服务可定制高性能网络的迫切需求。“我们的目标是赋能千行百业，...……更多

2025-01-04 10:00:00高铁,直达,数据,网络,设施,刘韵洁

大模型时代结束？大佬齐预测：AI模型或需先缩小规模，才能再次

...数据集，完全可以训练出一个规模更小，能力更强，更有推理能力的模型。可以在超大模型的帮助下，自动生成，清洗出质量更高的训练数据集。类似GPT-4o mini，就是用GPT-4清洗出来的数据训练的。先把模型做大，然后在此基础...……更多

2024-07-23 09:40:00大佬,模型,规模,再次,时代,模型

李彦宏一番话：重掀大模型开闭源争论

...追平闭源模型，就需要更大的参数规模，这将导致更高的推理成本和更慢的反应速度。此外，使用开源模型进行个性化改款，可能会创造出孤本模型，这些模型既无法从基础模型的持续升级中获益，也无法共享算力。但阿里云CTO...……更多

2024-07-05 16:36:00李彦,一番话,争论,模型,模型,李彦

GPT-4o的识图能力有多牛？四大维度深度体验

...，准确率高达100%。图片来源：GPT-4o四、手写指令和逻辑推理最后，记者上了点难度，用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美，不仅准确识别了手写体文字并遵照指示，且答题逻辑完全合...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...Ovis在OpenCompass上的测评数据情况据介绍，Ovis能够在数学推理问答、物体识别、文本提取和复杂任务决策等方面展现出色表现。例如，Ovis可以准确回答数学问题，识别花的品种，支持多种语言的文本提取，甚至可以识别手写字体...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

不用部署，实现大模型切换自由！Token、算力免费薅！

...可以通过页面底部的对话框对已处于启动状态的模型进行推理实测。如果频道中暂时没有处于启动状态的公共线路，您可以选择心仪的线路并一键启动。如何实现模型 API 切换自由？如所选模型实测频道的免费公共线路已处于启...……更多

2024-08-14 09:39:00切换,模型,不用,自由,模型,清湛

算力逻辑修复！各大厂商接入DS催化港股AI基建概念李彦宏称

...极发展成本较低的自有ASIC方案，并把重心从AI训练转往AI推理，预估将逐步推升AI推理服务器占比至接近50%。未来GPU仍将支持各种AI算法发展。中信证券的研报也指出，DeepSeek通过工程化能力创新，实现了大模型训练和推理算力成...……更多

2025-02-17 16:31:00大厂,李彦,港股,基建,催化,接入

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...的愿景是未来的多模态模型不再需要自行编写数据处理、推理以及提交代码。在当今多模态测试集高度集中的环境下，这种做法既不现实，测得的分数也难以与其他模型直接对比。通过接入 LMMs-Eval，模型训练者可以将更多精力...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

海信星海大模型接入DeepSeek

...矩阵，将通过模型蒸馏、强化学习等技术提升深度思考与推理能力，使得海信AI电视能够更准确地理解用户深层的意图和需求，为用户提供更流畅、更简单、更自然的交互与服务体验。海信电视正在进行用户终端的升级发布，预...……更多

2025-02-13 16:06:00海信,星海,接入,模型,海信,模型

加速落地京东云大模型已支持数百个场景

...、性能、效果三者取得一个比较好的平衡点。京东云自研推理引擎，协同大小模型，为大模型产业落地提供最佳实践，如通过利用推测解码，用小模型辅助大模型进行推理，加速大模型推理速度，降低成本。在大模型应用开发上...……更多

2024-06-07 11:04:00云大,京东,落地,模型,场景,支持

李开复：中国大模型与美国顶尖差距从7年缩短至6个月

...战时，李开复表示，在一定程度上，整个大模型行业每年推理成本降低到1/10是可以期待的，而且是必然也应该发生的，通过降低价格让更多的人体验到大模型产品对行业是一件好事。不过他也提到，相信大部分大模型创业者不...……更多

2024-05-21 23:32:00李开复,美国,中国,顶尖,模型,差距

page 16/1667 首页上一页 11 12 13 14 151617 18 19 20 21 下一页末页

更多关于科技的资讯：

能源革命与数据革命深度融合，电鸿生态加速电力系统数智化转型

初冬的广州南沙温暖如春、花团锦簇，大涌新春居民贺泽庶开着他心爱的电动车，开进了绿树与鲜花簇拥的广州南沙环市西路超充站，当车头对准充电桩时

2025-11-30 12:06:00

促进民营经济高质量发展·超能量的“中小微”（十九）｜乡村小厂

11月12日，智捷智能科技香河有限公司工作人员在室外场地对智能搬运叉车进行调试。河北日报记者刘英摄11月12日，天津滨海新区一处海滩上

2025-11-29 07:31:00

从2元到22.6元一份报纸为何被粉丝抢购收藏？

厦门网讯（厦门日报记者许舒昕）在注意力被算法切割的当下，一张纸质报纸竟在粉丝圈掀起抢购潮——从常规售价2元到二手平台单份22

2025-11-29 09:13:00

高校学生资助精准识别与分配的现实困境及成因

一、大数据视域下高校学生资助精准识别与分配的核心概念界定大数据技术是对数据进行加工、整理与计算的技术。其核心在于通过信息存储

2025-11-29 12:02:00

高校学生资助精准识别与分配机制的优化路径

大数据技术在高校学生资助工作中发挥了重要保障作用。相对于传统资助模式存在的问题。大数据通过整合多源数据、构建评估模型，能够实现从被动申请到主动发现的转变

2025-11-29 12:20:00

从迷失到笃行：一位古贝春经销商的二十载商海沉浮与顿悟

鲁网11月27日讯（记者赵洪斌）在鲁北商业版图上，王文俊的名字与古贝春酒业紧紧相连。然而，这段长达二十余年的合作关系

2025-11-28 08:45:00

宇太能源与河北某工业玻璃龙头企业签约合作

近日，广东宇太能源与河北某工业玻璃龙头企业签约，合作利用空微子发电技术降低企业电耗。该项目由玻璃企业投资，宇太能源提供技术及设备支持

2025-11-28 08:57:00

罗振宇、张夕勇、杨慧林、罗军民四位大咖重磅推荐，杨钧博士《未

百年汽车产业大变局的必读之作。近日，由国内汽车行业资深媒体人与研究观察者杨钧博士撰写的新书《竞速未来-全球新能源汽车的崛起与挑战》一书已由中国出版集团中译出版社正式出版发行

2025-11-28 09:27:00

科创创业人工智能ETF鹏华（588413）11月28日正式发

近日，鹏华基金发布公告，旗下科创创业人工智能ETF鹏华 (认购代码：588413)于11月28日正式发行。作为首批双创人工智能ETF中的一员

2025-11-28 10:11:00

入选概率不及万分之二，阿里千问斩获顶级AI会议最佳论文

11月28日消息，人工智能领域顶级会议NeurIPS 2025公布了论文奖，阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出

2025-11-28 11:01:00

启东这匹新材料赛道“黑马”，以12微米技术铸就国际竞争力

11月24日，位于启东市南阳镇的朗峰新材料启东有限公司生产车间内，自动化生产线高速运转，一条薄如蝉翼的银色金属带材从特制喷嘴中“飞”出

2025-11-28 11:05:00

济南轨道交通集团举办财务资本培训，实战专家孙春浩解析财务精英

近日，济南轨道交通集团全资子公司莱芜交通发展集团成功举办财务管理及融资业务培训。本次培训由集团财务管理部部长刘文芹主持

2025-11-28 11:09:00

锚定本土、驱动创新的金融实践！青岛银行荣膺CFV“最佳品牌竞

11月21日，在上海举办的“2025第一财经金融价值年会”上，青岛银行凭借在科技金融、绿色金融、地方经济服务及创新能力方面的突出表现

2025-11-28 11:18:00

挂号缴费不用跑！微信医保移动支付在北京140家公立医院全面上

近日，北京市参保市民就医迎来“智慧升级”——微信医保移动支付功能已在中国医学科学院、北京协和医院、北京大学人民医院等140家公立医院全面上线

2025-11-28 11:28:00

河北省煤田地质局物测队引入新装备提升探测能力

河北新闻网讯（吕若汐、齐彦红）11月18日，地球物理勘探设备供应商法国塞赛尔公司正式向河北省煤田地质局物测队交付了两套数字地震仪（激发系统）诺玛德65尼奥

2025-11-28 11:53:00

头条订阅服务