• 我的订阅
  • 头条热搜
字节豆包团队推出稀疏模型架构UltraMem:推理成本可降83%
...将计算和参数解耦,在保证模型效果的同时,有效解决了推理过程中的访存问题,为人工智能领域带来了新的突破。据了解,UltraMem架构巧妙地将计算与参数分离,不仅确保了模型的卓越性能,更针对推理过程中的访存瓶颈提出...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
清华团队开源大模型推理引擎“赤兔Chitu”:硬件成本削减50%
...授团队与清华系科创企业清程极智联合宣布,开源大模型推理引擎“赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。“赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精...……更多
...基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自...……更多
...测中,它的综合能力逼近当时的顶尖大模型,尤其在逻辑推理和数学题上展现出强劲性能,而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的,是它在训练方式上的简化。以往的模型在提升推理能力时,通常依...……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...0美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?《科...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)。从结...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩De...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
豆包大模型公布价格清单 支持国内最高并发标准
...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的 TPM(每分钟Tokens)、RPM(每分钟请求数)均达到国内最高标准。以豆包主力模型 pro-32k 为例,价格比行业低99%,TPM...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
复旦大学漆远:DeepSeek将推理成本降至百万token仅1元人民币,加速AI普及
...诞生聊天机器人产物。如今OpenAI o1、DeepSeek模型具备的强推理能力,让AI发展走到了又一重要分水岭。而未来研究方向或在于,像杨立昆提出的‘科学世界模型’,让AI更透彻的理解物理世界。”谈及最近爆火的国产AI“黑马”Deep...……更多
...天凌晨,阿里巴巴又默默干了件大事:发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习,它在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。在保持...……更多
CPU,正在被AI时代抛弃?
...以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大模型对...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
...占绝对大头的因素——算力。 现在提及大模型的训练和推理,很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势,但它所存在“硬伤”也是比较明显,那便是供应不足、价格昂贵。何以破局?国产大模...……更多
吴泳铭官宣3800亿投入后,阿里云如何打AI这场硬仗?
...发布新的模型,最重要的方向主要是两个,一个是Reasoning推理,一个是Omin全模态融合。”刘伟光提到。在应用方向上,这次大会,阿里云宣布推出AI Agent Store,从生成式AI向代理式AI发展,并表示将首先推动阿里旗下所有服务走...……更多
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院 供图“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型,能够在自然资源、...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
... OpenAI 在大语言模型领域的新尝试,也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看,相比以往的 GPT 模型,「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力,使其成为通用人...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
...层涟漪。3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...ta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameArena:通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...9月12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
对话贾扬清:明年AI推理成本还会降低10倍以上,一两年内AI使用成本或低于人工
...比之前更加乐观。他认为,“成本不是核心问题,Token的推理成本可能在接下去的一年还会再降低十倍,甚至更多。公司更应该关注的是用户体验。让AI使用成本降低到人工成本以下,可能就是一两年的时间。”他表示,“核心...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
... 2此次提供的90亿(9B)和270亿(27B)参数的两个版本,其推理性能和效率均优于第一代,并具有显著的安全性改进。事实上,270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争,并且提供了此前只有专有模型才能实...……更多
更多关于科技的资讯:
AI赋能千行百业一线故事(十六):数智驱动,唤醒高校“沉睡”的专利
数智驱动,唤醒高校“沉睡”的专利——AI赋能千行百业一线故事(十六)10月24日,邯郸职业技术学院知识产权学院工作人员演示AI+专利转化运用生态服务平台
2025-11-18 08:42:00
市场监管总局11月15日发布《互联网平台反垄断合规指引(征求意见稿)》,向社会公开征求意见。征求意见稿坚持问题导向,针对平台经济领域竞争行为的特点和趋势
2025-11-18 08:44:00
厦门网讯(厦门日报记者 林露虹 通讯员 郭文晨)美资企业安费诺加码投资厦门。近日,位于厦门创新创业园的安费诺(厦门)高速线缆有限公司新工厂正式投产
2025-11-18 09:03:00
“‘一带一路’——我们共同的路”全球故事征集活动启动 扫码阅读手机版
11月18日,由天津市政府新闻办指导,津云新媒体主办的“‘一带一路’——我们共同的路”全球故事征集活动启动。活动以高质量共建“一带一路”八项行动为指引
2025-11-18 09:06:00
中新经纬11月18日电 题:“它走得太像人了”——为什么必须由车企来完成这一步?作者 陈兵 南开大学法学院副院长、教授
2025-11-18 13:00:00
OceanBase发布首款AI数据库seekdb,探索数据库AI范式的跃迁
11月18日,在2025 OceanBase年度发布会上,OceanBase发布并开源了其首款AI数据库OceanBase seekdb(简称seekdb)
2025-11-18 13:21:00
全面满足用户本地生活服务需求,京东外卖App、点评、真榜、七鲜咖啡多箭齐发
11月17日晚,第三场京东品酒会在三亚保利瑰丽酒店举办。活动现场,京东宣布在本地生活领域密集落地一系列举措:推出京东外卖App
2025-11-18 13:21:00
安杰莱科技闪耀高交会:以科技赋能康复公益,斩获科技创新大奖
11月14日至16日,以“科技赋能产业,融合共创未来”为主旨的第二十七届中国国际高新技术成果交易会在深圳隆重举行。作为展现我国对外开放深度与广度的重要平台
2025-11-18 11:48:00
7×24小时自主巡检,杭州萧山机场添智能驱鸟装备
在航空运输业快速发展的今天,机场安全运行始终是行业关注的重点。鸟类撞击飞机的事件虽不常见,但一旦发生,可能对飞机引擎、机身结构造成损害
2025-11-18 10:47:00
“产业炬光灯”聚焦元之道生物科技
“产业炬光灯”聚焦厦门元之道生物科技有限公司。扫码看视频厦门网讯(厦门日报记者 李晓平)小小微生物,蕴藏着改变健康的大能量
2025-11-18 09:03:00
“安徽省电竞产业研究合作基地”聘任10名顾问
大皖新闻讯 2025年11月16日,安徽电竞创新发展大会在合肥举行。汇聚来自政府部门、行业协会、知名企业及高校的众多嘉宾
2025-11-17 09:24:00
为进一步提升网点服务能力与柜员专业素养,夯实业务基础,打造有温度的金融服务,近日,邮储银行唐山市分行组织开展了“星暖燕赵 星星闪耀”星级柜员竞赛活动
2025-11-17 10:07:00
张家口农商银行宣泰支行打破传统服务边界,以“线上服务提质、直播互动破圈、短视频赋能”为抓手,将便捷与温度融入数字金融场景
2025-11-17 10:11:00
阿里全力进军AI to C市场 千问APP上线公测
11月17日,阿里巴巴正式宣布“千问”项目,全力进军AI to C市场。当天,千问APP公测版上线,基于全球性能第一的开源模型Qwen3
2025-11-17 11:08:00
中新经纬11月17日电 据韩联社报道,三星集团将在未来五年对本土科学研究与试验发展等领域共投资450万亿韩元(约合人民币2
2025-11-17 11:48:00