• 我的订阅
  • 头条热搜
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...仅解码器LLM)作为文本编码器,以增强对提示词的理解和推理能力。尽管T2I生成模型多年来取得了显著进展,但大多数现有模型仍依赖CLIP或T5进行文本编码,这些模型往往缺乏强大的文本理解和指令跟随能力。与CLIP或T5不同,Gem...……更多
李彦宏:没有应用,基础模型将一文不值
...模型想要追平闭源模型的能力,需要有更大的参数,那么推理成本会更高,反应速度会更慢。一个激烈竞争的市场环境中,比拼的是业务效率和更低的成本,对此,“商业化的闭源模型是最能打的”。此前4月中旬,李彦宏的一...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
...占绝对大头的因素——算力。 现在提及大模型的训练和推理,很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势,但它所存在“硬伤”也是比较明显,那便是供应不足、价格昂贵。何以破局?国产大模...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 DiT(扩散 Transformer)...……更多
零一万物新模型盲测国产首超GPT-4o!李开复透露:一次训练成本超2000万
...消息称,国内大模型头部企业中有几家放弃预训练、转向推理端,对此李开复表示,不会放弃预训练,但这是个技术活,需要懂芯片、推理、模型、算法。李开复称,目前国内头部六家大模型企业融资额度都是够的,一次预训练...……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...结合了两个B200 GPU和一个独立的Grace CPU,将能够使大模型推理工作负载的性能提升30倍,同时提高效率。相比于H100,它可以“将成本和能源消耗降至1/25”。这就意味着,以前训练一个拥有1.8万亿参数的模型需要8000个Hopper GPU 和15...……更多
AI大厂硬刚价格战,中小模型夹缝求生存
...商无疑到了瓶颈期,就像阿里原副总裁贾扬清说的,降低推理成本、降低售价似乎成了一个“拍脑袋就可以做的简单策略”。目前看来,这场针对推理输入价格和API的价格战更多影响的是开发者,并不会直接影响到C端消费者。...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...以叫世界模型(world model),在「通用智能体规划」和「推理环境」中的关键组成部分,相比传统强化学习采样效率更高。但世界模型主要操作一系列离散潜在变量(discrete latent variables)以模拟环境动态,但这种压缩紧凑的离散...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多
超越YOLOv10/11、RT-DETRv2/3!D-FINE重新定义边界框回归任务
...TR,D-FINE-L 和 D-FINE-X 大幅降低了参数量和计算复杂度。在推理速度显著提升的同时,分别取得了 1.8% 和 3.2% 的显著性能提升。更轻量化的 D-FINE-S 和 D-FINE-M 在 T4 GPU 上分别以 3.49 ms (287 FPS) 和 5.62 ms (1……更多
商汤大装置:打造人工智能算力“样板间”,从AI 1.0跨越到2.0时代
...与GPT-4相匹配的能力。“大模型离不开大装置,从训练到推理,如果没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来,就是无本之源。”盛世伟透露,商汤将于 4月技术交流日上,推出“日日新”5.0大模型,见证...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多
阿里云挥出“三板斧”:免费也要挣到钱
...炼平台、灵积(DashScope)平台等,为用户提供模型训练、推理等所需的算力服务。这些平台不仅支持阿里云的通义系列,还集成了Llama、ChatGLM等系列开源大模型。用户通过API接口,能够在阿里云的公共云上直接调用这些模型,在...……更多
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...其不断交互才能变得聪明,待在实验室里并不会造福世界推理是下一个重要的进步节点,能提升数据训练效率,产生更有价值的结果对话实录部分要点整理Transformer因何横空出世?Illia Polosukhin:如果要做出能真正读取搜索结果的...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,...……更多
神州数码生成式AI战略升级,聚焦算力和AI应用工程平台研发|最前线
...于训练的高速成长阶段,基于我们对市场的理解,训练和推理的出货量大概在1:5 到1:6。随着未来人工智能在行业的深入应用,推理服务器会得到大量的部署。”AI应用工程平台也是神州数码接下来发力的重点方向。当前,企...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...代表Omni,也就是“全能”的意思。据介绍,GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频、音频功能得到改善。OpenAI CEO奥尔特曼(Sam Altman)在博客中表...……更多
千行百业加速拥抱大模型(AI前沿观察)
...库建设。”建设智算中心增加算力供给大模型进行训练和推理时,对算力的需求量巨大。算力是大模型的底座。算力通常分为通用算力、智能算力和超算算力,大模型需要的是智能算力。如何破解智能算力紧缺问题,成为大模型...……更多
PC迎来AI时刻,英特尔、微软、联想等纷纷布局,产品价格将迎上涨
...算力是上一代的8倍,可在PC上实现高能效的AI加速和本地推理,并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步,上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU,算力为16TOPS,AI性能相比上一代提升...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...质量多语言训练数据。模型的生成能力、创作能力和数学推理能力提升明显。3.最强中文语言建模能力:中文语言建模困惑度评测,超越所有中文开源模型 Skywork-13B系列大模型在中文语言建模方面表现出色,具有优秀的中文文创...……更多
...大模型需要大量的数据,底层有很多语料训练才能涌现出推理能力。金融业是对于数据安全和数据隐私保护最为重视的一个行业之一,所以开展大模型的探索,可能会存在一定的困难。目前各银行对于大模型的应用都还在探索阶...……更多
中兴通讯:全栈全场景智算解决方案,助力行业智能化转型升级
...整合现有的算力资源,实现多种算力统一管理和混合训练推理。基地可以根据不同的业务需求和数据规模,灵活调整算力配置和训练策略,提高资源使用效率,减少对单一供应商的依赖。此外,中兴通讯还通过量化压缩技术优化...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...能力的评测集上,Yi-34B同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。 各评测集得分:Yi模型v.s.其他开源模型和LLaMA2一样,Yi系列模型在GSM8k、MBPP的数学和代码评测表现略逊GPT模型。未来,零一万...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...翻译、思维链、工具使用等多种类型的指令数据, 在逻辑推理、关系推理、感知能力上都能呈现出较好的效果。 基于自研的基于语言大模型和多模态大模型,若愚科技构建了多模态具身决策大模型,凭借人类世界通用知识和强...……更多
硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?
...左右API“价格战”?在降价之外,有媒体指出,加快模型推理速度(即每秒生成Token的数量)也是硅谷大模型市场的主要竞争点。但“卷”价格、“卷”速度真的会赢得未来吗?硅谷在“拼”什么?5月中旬,字节跳动豆包以0.0008...……更多
...展开紧密协作,共同致力于本土算力和大型模型的训练与推理技术的发展。11月初,云从科技在投资者关系平台上答复投资者关心的问题时称,公司已与华为签署了全面合作框架协议,并已联合发布了从容大模型训推一体化解决...……更多
“女巴菲特”预期2030年人形机器人进入家庭,通用AI出现,重仓马斯克
...幅下降。AI 训练性能正在迅速提高。研究人员正在训练和推理、硬件和模型设计方面进行创新,以提高性能并降低成本。随着生产用例的出现,AI 焦点正在转向推理成本。最初关注 LLM 训练成本优化之后,研究人员现在正在优先...……更多
...广阔。面对市场面上各种大模型,一般认为,模型的思维推理能力与模型参数大小有正相关趋势。GPT-3发布时,其庞大的参数量让市场侧目,据介绍,其拥有超过1750亿参数,是当时世界上最大的语言模型。此后,国内大厂的大模...……更多
半个AI圈,向李彦宏“开炮”
...宏认为开源模型会越来越落后,最主要的理由还是训练和推理成本高。”但事实上,“office、数据库等人力成本很高的项目也有许多不错的开源项目,为何大模型就不行了呢?”“如果百度市占率高,那你的对手可能就会考虑推...……更多
更多关于科技的资讯:
生产周期缩短1/3,宇捷轴承凭核心技术领跑细分市场
齐鲁晚报·齐鲁壹点 陶春燕 山东省宇捷轴承制造有限公司是国家级专精特新重点“小巨人”企业、国内最大的调心滚子轴承生产企业
2025-09-27 20:05:00
电动车照亮小区应急通道?淄博供电验证居民V2G桩集群放电场景
当小区突发故障停电,地下车库里业主们的电动汽车,瞬间变身为一个巨大“充电宝”,为消防、通风和应急照明系统供电,守护社区安全
2025-09-27 12:35:00
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00