• 我的订阅
  • 头条热搜
微软华人团队发布全新基准AGIEval,专为人类考试而生
...2.5%,表明了目前基础模型的非凡表现。但GPT-4在需要复杂推理或特定领域知识的任务中不太熟练,文中对模型能力(理解、知识、推理和计算)的全面分析揭示了这些模型的优势和局限性。AGIEval数据集近年来,大型基础模型如GPT-4...……更多
石油巨头牵手DeepSeek
...仑大模型的问答应用“行业大家”目前已新增DeepSeek深度推理能力。用户使用“行业大家”开展行业问答时,除了可以得到昆仑大模型生成的能源化工领域专业问答结果,还能自主选择切换至“深度思考”模式,体验知识推理、...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...考两种模式。对于需要深入思考的复杂问题,模型会逐步推理,经过深思熟虑后给出最终答案。对于速度有要求的简单问题,模型则提供快速、近乎即时的响应,让用户实现对模型思考程度的控制。阿里通义团队认为,这两种模...……更多
OpenAI升级o3-mini模型思维链:提升AI推理过程透明度
...更新o3-mini-high的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。OpenAI在去年12月发布了推理模型o3,该系列包含两个模型,即o3和o3-mini,前者是高性能推理模型,后者是更小的精简版模型,在保持智能...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
...、大模型和应用场景融合,实现行业大模型跨广域精调、推理服务,改变过去只能在工厂端就近部署算力和模型的方式,降低企业使用行业大模型的门槛。测试结果显示,在相距超300公里的两家钢铁工厂之间,该技术成果使行业...……更多
对着3个中国AI大模型,两个美国科技界大佬深聊了半小时
...前AI行业快速发展,竞争也越来越激烈,特别是各种高级推理模型之间的竞争。过去一段时间,中国科技公司陆续发布了3款自研的AI模型,分别是DeepSeek(深度求索)的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
...资者关系活动记录表中表示,公司9月1日发布了风云卫大模型,现在还处于测试试用阶段,目前还没有单独针对大模型风云卫单产品的签单,后续以什么形式和模式进行签单现阶段暂不明确。绿盟科技专注于信息安全领域,在全...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...lVLM AI 视觉语言模型(VLM),仅有 20 亿参数,用于设备端推理,凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效,并且完全开源,所有模型检查点、VLM 数据集、训练...……更多
交通类 AI 项目预演阶段,本地化部署的一些新思路
...模型; 资源调度类:还有团队在考虑利用DeepSeek的深度推理能力,对历史流量、天气、事件等多源数据进行融合分析,开发出大模型能够动态地优化信号灯控制策略,提升路口通行效率和交通资源利用率。这其中,报告生成类...……更多
巅峰对谈:迈向 AGI 时代,除了优秀的大模型,还需要什么?|WISE2023颠覆AIGC产业发展峰会
...价值的技术,在激荡的环境中探寻前行的方向。在大会的巅峰对谈环节,蓝驰创投管理合伙人朱天宇与Fabarta创始人兼CEO高雪峰,围绕《迈向 AGI 时代,除了优秀的大模型,还需要什么?》这一主题,展开了讨论,聚焦三个方面:...……更多
唯一全国产算力训练!讯飞星火深度推理模型X1正式发布:多项指标国内第一
...天的新品发布会上,科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1,这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍,与通用大模型相比,X1的解题过程更接近人类的“慢思考”方式,并且...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...l Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是 ——「足够大...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...据具体询问的内容,模型只会激活不同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...的 agent,是关键的一步。而这篇论文就重点研究了扩展「推理期计算」(inference-time computation)这个问题。研究团队分析了扩展测试时计算的两种主要机制:(1)针对密集的、基于过程的验证器奖励模型进行搜索;(2)根据测...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...AMBADA,考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中360模型在四个评测数据集上达到第一,平均分为第三。在LongBench(多任务、中英双语、针对大语言模型长文本理解能力的评测基准)测...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数,……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果,但在纯文本任务上的性能却有显著...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多
更多关于科技的资讯:
智云(SCA生态发布会)圆满落幕 ——全球生态共振,开启智能新时代
【香港,2025年8月19日】由智云AI主办的SCA香港大会在香港盛大举行,并在热烈掌声和深度交流中圆满落幕。本次大会以“使命·品牌·生态”为主题
2025-08-23 13:05:00
不是不想买,是不会用!老年人买保险“数字鸿沟”谁来填?
“我爸今年60岁了,以前对保险没什么概念,这几年随着年龄增长、身体每况愈下,他开始意识到保障的重要性,可投保时犯了难,手机APP字太小
2025-08-22 08:08:00
●黄开典这个暑期,厦门文旅市场热度持续攀升。周杰伦、陈小春等歌手演唱会,乒超联赛等体育赛事陆续“登鹭”,一场场文体盛宴吸引全国各地的观众奔赴而来
2025-08-22 08:47:00
厦门网讯 (厦门日报记者 林露虹)国产钨钢钻头实现重大突破。近日,厦门麦达智能科技有限公司宣布,成功生产出直径仅0.009毫米(9微米)的钨钢钻头
2025-08-22 08:47:00
厦门网讯(厦门日报记者 陈泥)近日,市财政局联合市住房和建设局创新资产推介模式,首次在阿里巴巴资产交易和京东拍卖平台开展资产线上招商推介活动
2025-08-22 08:47:00
近日,中电鑫龙子公司安徽森源电器有限公司(以下简称“安徽森源”)再次凭借优质的产品性能与卓越的服务品质,签约河北瑞丰钢铁集团有限公司(以下简称 “瑞丰钢铁”)“145MW超临界煤气发电”及“170万吨焙烧机”两大关键工程
2025-08-22 09:13:00
现场网络流量激增167%!济宁移动全力保障“山东虾味鲜争霸赛”
大众网记者 刘迪 通讯员 吴广森 济宁报道8月14日至17日,“好客山东・美食争霸赛”第三场单品赛——“虾”路相逢・山东虾味鲜争霸赛在济宁市任城区津多里中心广场举办
2025-08-22 09:16:00
面对国内高端搬家市场日益增长的精细化服务需求,互联网搬家平台“蓝犀牛搬家”于近日宣布,对旗下的日式搬家服务进行重大升级
2025-08-22 09:19:00
新华社《半月谈》聚焦视源机器人:能巡逻、能巡检,四足机器狗已走进日常工作生活
你能想象一只机器狗在步行街巡逻、在变电站巡检、甚至还能帮你“上课”吗?这一切正在成为现实。近日,新华社《半月谈》专访视源股份高层段宇
2025-08-22 09:19:00
菏泽联通客户日:线上线下齐发力,暖心服务获赞无数
齐鲁晚报·齐鲁壹点 宋秋梅 通讯员 陈芳8月 19 日,菏泽联通客户日线下活动再度启程,10 个旗舰厅同步开展,通过提前邀约意向客户
2025-08-22 09:36:00
全省首次应用!十堰布设颗粒物通量激光雷达为空气做“CT扫描”
十堰广电讯(全媒体记者 赵向军 通讯员 叶相成 朱陈沁子)日前,在十堰市张湾区某小区楼顶,市生态环境局布设的一套球形三维扫描颗粒物通量激光雷达
2025-08-22 11:24:00
在方寸电站间磨砺出创新之刃
消费日报网讯(记者 冯举)在攀钢钒能源动力分公司热动专业区发电站,55MW发电机组冷风器冷油器在线反洗及串级节能操作法的成功应用
2025-08-22 11:44:00
从“谷子”到“痛金” IP赋能黄金产业年轻化发展
本报记者 卢 岳 □ 王琦琛根据世界黄金协会数据,2024年中国18岁至34岁消费者已成为黄金首饰消费的主力军。随着年轻人对黄金兴趣回归
2025-08-22 11:44:00
“演唱会+城市”叠加效应激发粉丝经济新活力
本报记者 卢 岳 □ 王琦琛今年夏天,北京仿佛化身为一座名为“MaydayLand”的城市主题公园。五月天“回到那一天”25周年巡回演唱会在鸟巢连开13场
2025-08-22 11:44:00
2025 年 7 月 21 日,聚焦计量检验检测一体化服务的数字化平台 —— 三测计量检测服务平台正式上线运营,该平台由深圳镎普检验技术有限公司主办
2025-08-22 12:21:00