• 我的订阅
  • 头条热搜
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「废话」,OpenAI ...……更多
被认可的大模型价格战
...要减少幻觉,同时需要有强大的记忆能力、查文献能力、推理能力,如果把行业上能共识的能力都投射到做医生的标准中,那么这便可以成为一个指标——“人造医生”就是AGI。 李大海则尝试从经济学的角度定义AGI。在他看来...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。在架构层面,Llama3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。Llama 3...……更多
百度加码AI见效?一季度智能云营收增42%,文心4.5模型6月将开源
...动力是来自各行业对生成式人工智能和基础模型在训练及推理方面的需求激增。” 百度集团执行副总裁、百度智能云事业群总裁沈抖解释称,随着基础模型近期迭代加速,各类模型训练需求快速增加,得益于百度在AI基础设施方...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
...,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域提升超40%。在C-eval、MMLU、AGIEVAL等国际权威榜单上,排名处于国内同级别参数开源模型的前列,进一步促进大模型开源生态繁荣,助力AI产业加速高...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...M) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会对通用智能的发展产生帮助?LLM 为什么会犯...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...复适配器进行微调,它们不会产生任何额外的内存使用或推理成本。关于适配器的大小,团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而,为了提供更多的灵活性,苹果提供了一套不同秩的精度恢复适...……更多
...在缺乏参考的情况下,成功复现媲美 OpenAI o1 模型的深度推理能力,而且应用程序接口(API)价格仅为后者的 1/30;此前DeepSeek V3 模型通过模型架构和基础软硬件的深度集成优化,实现与 GPT-4o 相当模型能力的同时,单次训练成本...……更多
...V3.1通过软件定义与更多芯片适配,能让超低精度训练、推理在中国自研芯片上更容易实现。业内人士指出,DeepSeek—V3.1的UE8M0FP8Scale助力国产AI软硬协同,AI正加速迈进应用落地的关键期,在政企示范引领、软硬协同创新、AI基建...……更多
IDC发布央国企大模型报告:科大讯飞市场份额第一!超百度阿里
...覆盖300多场景;星火X1是当前唯一全国产算力训练的深度推理大模型。此前科大讯飞就表示,和直接使用英伟达卡上开展的各种工程优化不同,科大讯飞选择了更难的全国产算力路线。虽然陆续有公司宣布可以在国产算力平台上...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
京东云:智能体大规模“上岗”,企业深度应用正当时
...模型一体机软硬协同,支持千人规模企业并发需求,实现推理速度提升50%,满血版、标准版、轻量版为不同规模企业提供灵活选择,助力企业快速构建企业级AI服务能力,极大降低专业技术门槛。今天,京东云正式发布三大垂直...……更多
“重创”美科技股后,DeepSeek除夕再发新模型,文生图测试优于OpenAI
...巨头幻方量化旗下大模型公司,1月20日,该公司正式发布推理大模型DeepSeek-R1。推出后不久,R1就凭借其开源的性质、大幅下降的售价和训练成本获得了广泛关注。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性...……更多
为AI加速而生 英特尔第五代至强CPU带来AI新表现
...来概括它的特点,那就是——AI味道越发得浓厚。以训练、推理大模型为例:• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;• 与第三代相比,AI训练和推理性能提升高达14倍。什么概念?现在若是将不超过200亿参数的模型...……更多
...约每18个月时间会增长40倍。现在生成式大模型的计算和推理都在云端进行,大模型参数和使用量的成倍增长带来巨大计算推理压力, 当数十亿用户都日常使用生成式AI时,云端模式显然难以支持生成式AI的规模化扩展。过大参数...……更多
李开复:现在卖AI大模型的方式行不通,需考虑技术和业务成本、要有客户买单
...标化、定制重、交付重的商业模式;另一方面则是要考虑推理成本,能够帮助企业客户核算 ROI,在不赔钱的前提下做规模增长,是模型能力在 ToB 方向落地的基础。当前,中国大模型初创公司的应用生态和融资环境与美国有着一...……更多
成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型
...现突破,于近日全国首发基于扩散架构的人形机器人高速推理模型 R-DDIRM(Denoising Diffusion Implicit Robot Model)。这是继今年 5 月推出中国首个基于扩散架构人形机器人任务生成式模型 R-DDPRM(Denoising Diffusion Proba……更多
...方案支持适配DeepSeek R1开源大模型,实现AI模型在训练及推理侧的高性能、低成本及可用性的进一步优化,满足不同规模参数量模型的需求。在提供多元算力服务的同时,科华数据通过自有的算力平台与国产AI芯片厂商深度战略协...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
让AI无处不在 高通全面开启终端侧生成式AI大门
...效提升了40%。Hexagon NPU集成了硬件加速单元、微型区块推理单元、性能加强的张量/标量/矢量单元,同时所有单元共享2倍带宽的大容量共享内存。 这意味着用户在搭载第三代骁龙8的设备上可以按照自己的需要自由生成类似于...……更多
...部署复杂的硬件设施,即可通过统一接口调用包括生成、推理、训练在内的全栈模型功能。平台还同步支持私有数据微调、知识库搭建等深度定制服务,全方位助力企业快速构建专属AI应用生态,为企业的数字化转型和智能化发...……更多
谷歌发布gemma2大语言模型,共有两种大小
...亿参数(27B)两种大小。Gemma2大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。谷歌在新闻稿中表示,Gemma2-27B模型的性能媲美两倍规模的主流模型,而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多
连发两款模型“补课”,百度AI成色如何?
...李彦宏,百度近日低调发布两款大模型——文心4.5和深度推理模型文心X1,免费。两年前的3月,百度发布了对标ChatGPT的文心一言。这是全球大厂中首个生成式AI产品,也让外界看到百度相对迅速的先手布局。不过,百度后来采取...……更多
专家模型不要专家并行!微软开源MoE新路径
...好,所以要在左上角: GRIN作为MoE架构,总参数量约42B,推理时激活的参数为6.6B,打同级别(7B)的非MoE模型是手拿把攥,甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中,GRIN MoE表现优异,尤其是在编码和数学测试中。...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
...型,Llama-3.1-Nemotron-51B 在保持了几乎相同的精度情况下,推理速度提高了 2.2 倍。准确率能效MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3……更多
始于安全,不止安全丨迪普科技AI基座解决方案发布
...解析能力、上下文连贯的多轮对话交互及高精度复杂逻辑推理三大技术特质。 AI基础网络:加速智算网络,赋能行业高效发展 在AI技术飞速发展的大环境下,智算中心作为AI应用的关键基础设施,正迎来前所未有的发展机遇。...……更多
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
...然没有资本市场那么高亢。技术派更关注FP8在模型训练、推理及生态标准化上的实际价值与挑战。▍FP8是什么,有哪些提升?在AI训练与推理过程中,为提升计算效率,数值精度的降低是一个常见的技术路径。摩尔线程AI Infra总...……更多
ChatGPT走红背后:苦熬五年,三次AI路线迭代|行业观察
...就需要花费约2000万美元。而如果仅拿大模型去做微调和推理,本地也需要好几千GB的内存。潞晨科技创始人尤洋也曾提及,想把大模型部署到生产线,若一个企业从零开始自己做会需要70人左右的人力。而在欧美地区光是养活70...……更多
苹果推出DeepPCR 神经网络训练和推理速度提升7倍
...该算法通过并行处理常规顺序操作,可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务,但由于计算需求过大,神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多
更多关于科技的资讯:
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00
近日,一项重要国家标准——《电磁兼容 电磁兼容标准起草导则》工作会议在云栖小镇召开。这份由上海机器人产业技术研究院牵头起草的文件
2025-12-07 08:53:00
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00
2025教室节能照明标杆盘点 四大品牌绿色护眼解决方案解析
在“双碳”目标引领下,校园节能改造成为教育领域绿色发展的重要方向。据住建部统计,商业建筑能耗中照明系统占比高达35%,学校作为人员密集
2025-12-06 16:09:00
海尔智慧家电亮相迪拜
11月26日至28日,中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中,海尔智家针对当地高温、多尘等特点,集中展示了洗衣机
2025-12-06 16:10:00
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础,与手机厂商在操作系统层面合作开发的AI助手软件
2025-12-06 17:41:00
文化中国行|全场听觉无死角 吉林省音乐厅声学揭秘
历经修缮重生的丰乐剧场,以“吉林省音乐厅”之名即将绽放春城。这座历史建筑,从伪满时期影剧院到音乐剧场的跨越,背后藏着一套极致考究的声学设计方案
2025-12-06 18:41:00