• 我的订阅
  • 头条热搜
石油巨头牵手DeepSeek
...仑大模型的问答应用“行业大家”目前已新增DeepSeek深度推理能力。用户使用“行业大家”开展行业问答时,除了可以得到昆仑大模型生成的能源化工领域专业问答结果,还能自主选择切换至“深度思考”模式,体验知识推理、...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...考两种模式。对于需要深入思考的复杂问题,模型会逐步推理,经过深思熟虑后给出最终答案。对于速度有要求的简单问题,模型则提供快速、近乎即时的响应,让用户实现对模型思考程度的控制。阿里通义团队认为,这两种模...……更多
OpenAI升级o3-mini模型思维链:提升AI推理过程透明度
...更新o3-mini-high的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。OpenAI在去年12月发布了推理模型o3,该系列包含两个模型,即o3和o3-mini,前者是高性能推理模型,后者是更小的精简版模型,在保持智能...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
对着3个中国AI大模型,两个美国科技界大佬深聊了半小时
...前AI行业快速发展,竞争也越来越激烈,特别是各种高级推理模型之间的竞争。过去一段时间,中国科技公司陆续发布了3款自研的AI模型,分别是DeepSeek(深度求索)的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多
...资者关系活动记录表中表示,公司9月1日发布了风云卫大模型,现在还处于测试试用阶段,目前还没有单独针对大模型风云卫单产品的签单,后续以什么形式和模式进行签单现阶段暂不明确。绿盟科技专注于信息安全领域,在全...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...lVLM AI 视觉语言模型(VLM),仅有 20 亿参数,用于设备端推理,凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效,并且完全开源,所有模型检查点、VLM 数据集、训练...……更多
交通类 AI 项目预演阶段,本地化部署的一些新思路
...模型; 资源调度类:还有团队在考虑利用DeepSeek的深度推理能力,对历史流量、天气、事件等多源数据进行融合分析,开发出大模型能够动态地优化信号灯控制策略,提升路口通行效率和交通资源利用率。这其中,报告生成类...……更多
唯一全国产算力训练!讯飞星火深度推理模型X1正式发布:多项指标国内第一
...天的新品发布会上,科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1,这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍,与通用大模型相比,X1的解题过程更接近人类的“慢思考”方式,并且...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...l Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是 ——「足够大...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...据具体询问的内容,模型只会激活不同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...的 agent,是关键的一步。而这篇论文就重点研究了扩展「推理期计算」(inference-time computation)这个问题。研究团队分析了扩展测试时计算的两种主要机制:(1)针对密集的、基于过程的验证器奖励模型进行搜索;(2)根据测...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...AMBADA,考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中360模型在四个评测数据集上达到第一,平均分为第三。在LongBench(多任务、中英双语、针对大语言模型长文本理解能力的评测基准)测...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数,……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果,但在纯文本任务上的性能却有显著...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多
马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题
...上一代模型,Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面表现都有显著改进。值得一提的是,Grok-2在数学推理(MathVista)方面表现登顶测试榜首。但细心网友不难发现,即便是Grok-2,在其他方面与前沿模型GPT-4o或Claude ...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...在MMLU(多任务语言理解)、Knowledge(知识)、Reasoning(推理)、Comprehension(理解)等关键指标上均超越了Meta Llama 2的13B模型。这一个故事,在2024年2月1日的发布会上,也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
... OpenAI 在大语言模型领域的新尝试,也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看,相比以往的 GPT 模型,「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力,使其成为通用人...……更多
更多关于财经的资讯:
贵州企业“创客中国”全国总决赛斩获全国三等奖
11月27日,第十届“创客中国”中小企业创新创业大赛全国总决赛圆满落幕。在这场代表全国中小企业最高创新水平的巅峰对决中
2025-12-06 05:29:00
东华软件成立新公司,含智能农业管理业务
近日,东华软件(塔城市)有限公司成立,注册资本5000万元,经营范围包含:智能控制系统集成;智能农业管理;大数据服务;数据处理服务等。企查查股权穿透显示,该公司由东华软件(002
2025-12-05 14:24:00
赣锋锂业、世荣兆业成立新能源公司,含热力生产和供应业务
近日,南昌珠赣新能源有限公司成立,法定代表人为余少华,注册资本为2000万元,经营范围包含:热力生产和供应,生物质燃料加工
2025-12-05 14:24:00
岱美股份成立智创机器人科技公司
近日,上海岱美智创机器人科技有限公司成立,注册资本1亿元,经营范围包含:智能机器人的研发;工业机器人制造;特殊作业机器人制造;服务消费机器人制造等。企查查股权穿透显示,该公司由岱
2025-12-05 14:24:00
三一重工成立智能机械公司
近日,安徽三昱智能机械有限公司成立,法定代表人为柴文俊,注册资本为1000万元,经营范围包含:机械设备销售;建筑工程用机械销售
2025-12-05 14:24:00
东方电气投资成立数智科技公司
近日,东方电气(安平)数智科技有限公司成立,法定代表人为王潇,经营范围包含:新兴能源技术研发;储能技术服务;合同能源管理
2025-12-05 14:36:00
“公益+教育”守护平安路 平安产险河南分公司积极探索交通安全治理新路径
大河网讯 近日,在河南,农村地区面临道路交通安全事故高发的严峻挑战。信号灯缺失的“盲区”、路网交织的“迷宫”、安全意识的“短板”
2025-12-05 14:54:00
平安产险许昌中心支公司亮相交通安全宣传日 互动宣教彰显专业与温度
大河网讯 12月2日上午,由许昌市交警支队与许昌广播电视台联合主办的第十四个“全国交通安全日”启动仪式在许昌中原科技学院自强报告厅举行
2025-12-05 14:54:00
交行郑州航空港区支行:反洗钱知识进乡村 筑牢基层金融安全防线
大河网讯 为深入贯彻《中华人民共和国反洗钱法》,破解农村地区金融知识普及薄弱难题,近日,交通银行郑州航空港区支行组建专业宣传团队
2025-12-05 14:55:00
平安产险商丘中心支公司联合交警一大队开展“全国交通安全日”主题宣传活动
大河网讯 12月2日,在第12个“全国交通安全日”到来之际,平安产险商丘中心支公司联合商丘市公安局交警支队一大队,以及1007商丘交通广播
2025-12-05 14:55:00
平安产险洛阳中心支公司获洛阳市公安交通管理支队感谢信
大河网讯 12月1日,平安产险洛阳中心支公司收到洛阳市公安局交通管理支队送来的感谢信,感谢信中对公司热心公益、助力道路交通安全隐患治理工作给予高度肯定
2025-12-05 14:55:00
华夏金融租赁因租赁物不合规、管理不审慎被罚65万元
12月4日,云南金融监管局行政处罚信息公示列表显示,华夏金融租赁有限公司及相关责任人因租赁物不符合监管要求、构筑物租赁业务风险分类管理不审慎被罚款65万元;责任人刘某勇被警告。
2025-12-05 15:12:00
富德生命人寿阿克苏中心支公司因财务数据造假、宣传材料不合规被罚10.5万元
12月4日,阿克苏金融监管分局行政处罚信息公示列表显示,富德生命人寿保险股份有限公司阿克苏中心支公司及相关责任人因财务数据不真实、业务宣传材料不合规被警告并罚款10.5万元。陈某
2025-12-05 15:15:00
海尔周云杰:做企业家IP应该坚守三个原则
12月4日,在2025企业家博鳌论坛期间,海尔集团董事局主席、首席执行官周云杰接受新华社专访,分享了做企业家IP的战略思考与实践路径
2025-12-05 15:31:00
潘峰获批担任郑州银行首席风险官
12月5日,河南金融监管局发布关于潘峰郑州银行股份有限公司首席风险官任职资格的批复,核准潘峰郑州银行股份有限公司首席风险官的任职资格。
2025-12-05 15:58:00