• 我的订阅
  • 头条热搜
...大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...仅解码器LLM)作为文本编码器,以增强对提示词的理解和推理能力。尽管T2I生成模型多年来取得了显著进展,但大多数现有模型仍依赖CLIP或T5进行文本编码,这些模型往往缺乏强大的文本理解和指令跟随能力。与CLIP或T5不同,Gem...……更多
李彦宏:没有应用,基础模型将一文不值
...模型想要追平闭源模型的能力,需要有更大的参数,那么推理成本会更高,反应速度会更慢。一个激烈竞争的市场环境中,比拼的是业务效率和更低的成本,对此,“商业化的闭源模型是最能打的”。此前4月中旬,李彦宏的一...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
...占绝对大头的因素——算力。 现在提及大模型的训练和推理,很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势,但它所存在“硬伤”也是比较明显,那便是供应不足、价格昂贵。何以破局?国产大模...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 DiT(扩散 Transformer)...……更多
零一万物新模型盲测国产首超GPT-4o!李开复透露:一次训练成本超2000万
...消息称,国内大模型头部企业中有几家放弃预训练、转向推理端,对此李开复表示,不会放弃预训练,但这是个技术活,需要懂芯片、推理、模型、算法。李开复称,目前国内头部六家大模型企业融资额度都是够的,一次预训练...……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...结合了两个B200 GPU和一个独立的Grace CPU,将能够使大模型推理工作负载的性能提升30倍,同时提高效率。相比于H100,它可以“将成本和能源消耗降至1/25”。这就意味着,以前训练一个拥有1.8万亿参数的模型需要8000个Hopper GPU 和15...……更多
AI大厂硬刚价格战,中小模型夹缝求生存
...商无疑到了瓶颈期,就像阿里原副总裁贾扬清说的,降低推理成本、降低售价似乎成了一个“拍脑袋就可以做的简单策略”。目前看来,这场针对推理输入价格和API的价格战更多影响的是开发者,并不会直接影响到C端消费者。...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...以叫世界模型(world model),在「通用智能体规划」和「推理环境」中的关键组成部分,相比传统强化学习采样效率更高。但世界模型主要操作一系列离散潜在变量(discrete latent variables)以模拟环境动态,但这种压缩紧凑的离散...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多
超越YOLOv10/11、RT-DETRv2/3!D-FINE重新定义边界框回归任务
...TR,D-FINE-L 和 D-FINE-X 大幅降低了参数量和计算复杂度。在推理速度显著提升的同时,分别取得了 1.8% 和 3.2% 的显著性能提升。更轻量化的 D-FINE-S 和 D-FINE-M 在 T4 GPU 上分别以 3.49 ms (287 FPS) 和 5.62 ms (1……更多
商汤大装置:打造人工智能算力“样板间”,从AI 1.0跨越到2.0时代
...与GPT-4相匹配的能力。“大模型离不开大装置,从训练到推理,如果没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来,就是无本之源。”盛世伟透露,商汤将于 4月技术交流日上,推出“日日新”5.0大模型,见证...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多
阿里云挥出“三板斧”:免费也要挣到钱
...炼平台、灵积(DashScope)平台等,为用户提供模型训练、推理等所需的算力服务。这些平台不仅支持阿里云的通义系列,还集成了Llama、ChatGLM等系列开源大模型。用户通过API接口,能够在阿里云的公共云上直接调用这些模型,在...……更多
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...其不断交互才能变得聪明,待在实验室里并不会造福世界推理是下一个重要的进步节点,能提升数据训练效率,产生更有价值的结果对话实录部分要点整理Transformer因何横空出世?Illia Polosukhin:如果要做出能真正读取搜索结果的...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,...……更多
神州数码生成式AI战略升级,聚焦算力和AI应用工程平台研发|最前线
...于训练的高速成长阶段,基于我们对市场的理解,训练和推理的出货量大概在1:5 到1:6。随着未来人工智能在行业的深入应用,推理服务器会得到大量的部署。”AI应用工程平台也是神州数码接下来发力的重点方向。当前,企...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...代表Omni,也就是“全能”的意思。据介绍,GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频、音频功能得到改善。OpenAI CEO奥尔特曼(Sam Altman)在博客中表...……更多
千行百业加速拥抱大模型(AI前沿观察)
...库建设。”建设智算中心增加算力供给大模型进行训练和推理时,对算力的需求量巨大。算力是大模型的底座。算力通常分为通用算力、智能算力和超算算力,大模型需要的是智能算力。如何破解智能算力紧缺问题,成为大模型...……更多
PC迎来AI时刻,英特尔、微软、联想等纷纷布局,产品价格将迎上涨
...算力是上一代的8倍,可在PC上实现高能效的AI加速和本地推理,并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步,上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU,算力为16TOPS,AI性能相比上一代提升...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...质量多语言训练数据。模型的生成能力、创作能力和数学推理能力提升明显。3.最强中文语言建模能力:中文语言建模困惑度评测,超越所有中文开源模型 Skywork-13B系列大模型在中文语言建模方面表现出色,具有优秀的中文文创...……更多
...大模型需要大量的数据,底层有很多语料训练才能涌现出推理能力。金融业是对于数据安全和数据隐私保护最为重视的一个行业之一,所以开展大模型的探索,可能会存在一定的困难。目前各银行对于大模型的应用都还在探索阶...……更多
中兴通讯:全栈全场景智算解决方案,助力行业智能化转型升级
...整合现有的算力资源,实现多种算力统一管理和混合训练推理。基地可以根据不同的业务需求和数据规模,灵活调整算力配置和训练策略,提高资源使用效率,减少对单一供应商的依赖。此外,中兴通讯还通过量化压缩技术优化...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...能力的评测集上,Yi-34B同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。 各评测集得分:Yi模型v.s.其他开源模型和LLaMA2一样,Yi系列模型在GSM8k、MBPP的数学和代码评测表现略逊GPT模型。未来,零一万...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...翻译、思维链、工具使用等多种类型的指令数据, 在逻辑推理、关系推理、感知能力上都能呈现出较好的效果。 基于自研的基于语言大模型和多模态大模型,若愚科技构建了多模态具身决策大模型,凭借人类世界通用知识和强...……更多
硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?
...左右API“价格战”?在降价之外,有媒体指出,加快模型推理速度(即每秒生成Token的数量)也是硅谷大模型市场的主要竞争点。但“卷”价格、“卷”速度真的会赢得未来吗?硅谷在“拼”什么?5月中旬,字节跳动豆包以0.0008...……更多
...展开紧密协作,共同致力于本土算力和大型模型的训练与推理技术的发展。11月初,云从科技在投资者关系平台上答复投资者关心的问题时称,公司已与华为签署了全面合作框架协议,并已联合发布了从容大模型训推一体化解决...……更多
“女巴菲特”预期2030年人形机器人进入家庭,通用AI出现,重仓马斯克
...幅下降。AI 训练性能正在迅速提高。研究人员正在训练和推理、硬件和模型设计方面进行创新,以提高性能并降低成本。随着生产用例的出现,AI 焦点正在转向推理成本。最初关注 LLM 训练成本优化之后,研究人员现在正在优先...……更多
...广阔。面对市场面上各种大模型,一般认为,模型的思维推理能力与模型参数大小有正相关趋势。GPT-3发布时,其庞大的参数量让市场侧目,据介绍,其拥有超过1750亿参数,是当时世界上最大的语言模型。此后,国内大厂的大模...……更多
更多关于科技的资讯:
鲁网9月28日讯金融是经济的血脉,更是百姓生活的依托。在中国经济迈向高质量发展的今天,中国建设银行青岛市分行以国有大行的责任与担当
2025-09-28 10:37:00
五年连获七家世界知名轴承制造企业认证一根轴承钢转动全球——“铁疙瘩”怎样变成“金娃娃”(九)前不久,河钢集团石钢公司收到日本某国际知名轴承企业高碳铬轴承钢的认证邮件
2025-09-28 08:04:00
锚定新赛道 壮大新动能超31亿元新一代工业软件基地项目开工南报网讯(记者刘安琪)项目兴则产业兴,项目强则经济强。9月26日上午
2025-09-28 07:43:00
山东移动成功入选2025年度山东省中小企业服务支撑机构
近日,山东省轻工联社发布《关于公布2025年度山东省中小企业服务支撑机构名单的通知》,山东移动成功入选。作为推动中小企业数字化转型的主力军
2025-09-27 08:11:00
南报网讯(记者卫凌云通讯员建萱)9月26日,2025南京河西中央科创区生态建设推进会举行,“大厂+大学+大所”创新平台揭牌
2025-09-27 09:53:00
山东移动淄博公司织就高速信息网络,筑牢“数字淄博”智慧生命线
在数字化浪潮席卷而来的今天,信息传输网络如同城市的“神经网络”,是智慧城市运转的核心支撑。作为这一无形“生命线”的守护者
2025-09-27 12:34:00
迭代焕新“吾悦经营五步法”,新城控股再启商业新篇
9月24日-25日,新城控股“2025第八届商业年会暨吾悦商管第一届悦链计划合伙人大会”在上海西岸美高梅酒店举行,新城控股集团董事长王晓松及公司高管
2025-09-27 12:37:00
25日上午,以“上山下山·食在晋安”为主题的晋安区“一县一桌菜”云上发布会举行,12道“云端”盛宴引爆味蕾。
2025-09-27 13:53:00
产业链协同驱动 新奥加速冲刺氢硼聚变
河北新闻网讯(张新)2025年,是我国“十四五”规划收官之年,也是“双碳”目标提出五周年。在此背景下,央视《东方时空》栏目近日推出“可控核聚变专题”
2025-09-27 14:45:00
9月25日,国网山西省电力公司发布消息,该公司成功完成配电网无人机电力北斗定位服务的全面应用,标志着该公司依托电力北斗高精度定位服务
2025-09-27 19:56:00
谢志强:从金融菁英到人才“伯乐”,以产学研融合破局就业困境
谢志强,现任中科汇理信息技术研究院党支部书记、秘书长、中科产学研合作一体化人才培育开发平台项目主任。历任中国银行总行风险管理部业务经理
2025-09-27 20:20:00
聚焦数贸会 | 工匠行:机器狗能听会说还会自主巡逻
在第四届全球数字博览会上,贵州工匠行科技有限公司展出的SomaSeek具身智能平台,让机器人彻底告别了遥控器,也能听会说
2025-09-27 22:17:00
企业新市场何处寻?潍坊这场产业国际精准对接会送来“及时雨”
齐鲁晚报·齐鲁壹点 胡晓雪 李国栋9月26日,2025潍坊纺织服装产业国际精准对接活动在奎文区成功举办,本次活动以“我帮企业组主场·我为企业找订单”为主题
2025-09-27 22:22:00
生产周期缩短1/3,宇捷轴承凭核心技术领跑细分市场
齐鲁晚报·齐鲁壹点 陶春燕 山东省宇捷轴承制造有限公司是国家级专精特新重点“小巨人”企业、国内最大的调心滚子轴承生产企业
2025-09-27 20:05:00
电动车照亮小区应急通道?淄博供电验证居民V2G桩集群放电场景
当小区突发故障停电,地下车库里业主们的电动汽车,瞬间变身为一个巨大“充电宝”,为消防、通风和应急照明系统供电,守护社区安全
2025-09-27 12:35:00