• 我的订阅
  • 头条热搜
香港金融科技周|度小满CEO朱光:推理大模型将深入到金融核心业务
...注的话题。度小满CEO朱光在科技周主论坛上表示,“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用,将从外围场景深入到核心业务,直接影响金融行业的核心决策质量,在为客户的产品和服务体验上带来巨大突...……更多
小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini
...快科技4月30日消息,小米官方今天正式宣布,开源首个为推理(Reasoning)而生的大模型——Xiaomi MiMo。据介绍,Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭……更多
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...SA 预训练的模型在一般基准、长上下文任务和基于指令的推理中保持或超过了全注意力模型。同时,NSA在64k长度序列的解码、前向传播和后向传播过程中实现比全注意力机制显著的加速,验证其在整个模型生命周期中的效率。“...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
...天凌晨,阿里巴巴又默默干了件大事:发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习,它在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。在保持...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型一体机能支撑企业将基座模...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...达14.3%,显著高于DeepSeek-V3的3.9%,也远远超过行业的其他推理模型,比如OpenAI-o1的测试结果是2.4%。这种AI大模型生成内容与真实数据不符,或偏离用户指令的现象,会极大影响用户的使用体验。在医疗、法律、金融等对准确性要...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程:首先将输入语音内容转换为文本,其次利用大语言模型进行文本推理,最后利用...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...类模型低 75%。端侧友好:量化后端侧内存仅占 6 GB;端侧推理速度高达 18 tokens/s,相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理;且支持多种语言。统一高清框架,高效能力一拖三:小钢炮的传统优势 OCR 能力延...……更多
实现从“知道”到“懂得”的性能飞跃东大发布深度推理法律垂域大模型南报网讯(记者何洁通讯员毕胜)近日,东南大学法学院数字法学团队依托东南大学大数据计算中心,正式发布国内高校首个深度推理法律垂域大模型—...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...ta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameArena:通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...CLM-Baseline取得了更高的平均分,且在ARC(小学生科学问题推理)、HellaSwag(常识推理)、MMLU等任务上表现更好。 “小”模型成新趋势回到开头,“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”,其中包含1...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
超强AI来袭!OpenAI最新AI模型 “草莓”即将上线,推理能力惊艳
...但其实这个模型的能力可不容小觑,它能够通过多步骤的推理解决复杂的问题。根据《信息》网站的报道,“草莓” 模型将视为一种推理模型,这意味着它能够处理一些需要多步骤来完成的请求,比如解答难度较大的代数题,...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelli...……更多
亚马逊推出“自动推理检查”工具,对抗 AI 幻觉
...拉斯维加斯举办的 re:Invent 2024 大会上,AWS 推出了“自动推理检查”(Automated Reasoning checks)工具,该工具通过交叉引用客户提供的信息来验证模型的响应准确性。AWS 宣称,这是“第一个”也是“唯一”的针对幻觉的防护措施。...……更多
IDC:中国大模型推理市场爆发,九章云极以\\\
近日,IDC发布《2025中国大模型推理算力市场分析报告》指出,大模型与生成式AI的推理算力建设已成为当前产业发展的关键环节。报告预测,2024年中国生成式AI基础设施市场规模将达到2091.9亿元。九章云极凭借在AI基础设施市场...……更多
联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-mini
...想展示了其在端侧算力方面的最新创新成果 —— “联想推理加速引擎”。据了解,这款由联想、清华大学及无问芯穹联合研发的推理引擎,是专为高效AI PC推理而设计的软硬件协同优化平台,可以让一台普通PC的本地推理能力,...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...次采取扩容等措施保证流量异常增高后的稳定,这对Kimi推理算力、成本等也构成挑战。实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单...……更多
华为联合WPS AI,见证昇腾大模型推理应用启航
...华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践,共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推理解...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
OpenAI CEO承认了!DeepSeek非常棒 不会起诉
...了业界对于“AI算力需求”的看法。特别是DeepSeek推出的推理大模型DeepSeek-R1,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20(仅用了2048 个 H800 GPU,花了两个月的时间训练完成,仅花费了约558万美元),AP...……更多
美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开源
...收涨14.2%,报7.4港元。消息面上,今天,小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。 在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)。从结...……更多
更多关于财经的资讯:
新华保险邯郸中支理赔64.5万元诠释保障真谛
7月,新华保险邯郸中支服务人员在为S先生进行保单整理时,发现客户早在2021年7月就确诊恶性肿瘤却未申请理赔。工作人员立即协助客户办理理赔手续
2025-12-01 18:18:00
浦发银行获准收购重庆铜梁浦发村镇银行并设立铜梁支行
12月1日,重庆监管局发布关于关于上海浦东发展银行股份有限公司收购重庆铜梁浦发村镇银行股份有限公司并设立分支机构的批复
2025-12-01 17:36:00
司南导航在杭州成立新公司,含多项卫星业务
近日,杭州司南导航技术有限公司成立,法定代表人为王振国,经营范围包含:导航终端销售;卫星技术综合应用系统集成;卫星遥感数据处理;智能机器人销售;智能无人飞行器销售等。企查查股权穿
2025-12-01 16:00:00
永福股份成立聚能储能技术公司
近日,自贡永福聚能储能技术有限公司成立,法定代表人为杨艳清,经营范围包含:储能技术服务;新兴能源技术研发;供应链管理服务
2025-12-01 16:00:00
中银香港捐 2000 万港元支持香港火灾救灾 豁免多项银行服务费用
11月27日,中国银行(香港)有限公司发布公告称,中银香港将向火灾灾民捐款港币2,000万元,本次捐款用于紧急救灾及灾后复原工作
2025-12-01 12:34:00
取款不再“一刀切”询问,重塑服务温度
29日,三部门联合发布《金融机构客户尽职调查和客户身份资料及交易记录保存管理办法》。其中,“个人存取现金超5万元需登记资金来源”的规定取消
2025-12-01 12:42:00
建银国际捐款200万港元 心系火灾受灾市民
11月28日,建银国际发布公告称,建银国际心系受灾市民,发动公司倡议,募集善款200万港元,用于应急救灾和社区重建等工作
2025-12-01 12:43:00
中国太保紧急捐赠1000万港元驰援香港火灾 并启动多项应急服务举措
11月28日,中国太平洋保险发布公告称,针对香港大埔火灾,中国太保高度重视,快速启动应急响应机制,旗下中国太保产险香港公司
2025-12-01 12:47:00
律商风险受邀出席泰康在线十周年盛典
11月18日,泰康在线财产保险股份有限公司(以下简称“泰康在线”)在北京隆重举办“拾光绽放,向新而行——泰康在线十周年盛典暨合作伙伴大会”
2025-12-01 12:49:00
辛杰卸任深圳地铁集团法定代表人,由黄力平接任
近日,深圳市地铁集团有限公司发生工商变更,辛杰卸任法定代表人,由黄力平接任,同时,黄力平由总经理改任经理。企查查信息显示
2025-12-01 13:00:00
友邦香港捐资2000万港元 援助大埔火灾受灾社区
11月27日,友邦香港表示,对大埔宏福苑发生的严重火灾深感悲痛,并向所有受影响人士及其家人致以深切慰问。为支援社区的即时需要,友邦香港会透过友邦慈善基金捐出港币2,000万元,提
2025-12-01 13:16:00
度小满捐赠1000万港元 支援香港大埔火灾紧急救援与灾后重建
11月27日,度小满发布公告称,香港大埔宏福苑发生五级火灾,造成重大人员伤亡,灾情牵动社会各界关注。度小满宣布捐赠1000万港元
2025-12-01 13:21:00
汇丰及恒生银行捐款3000万港元,支援香港宏福苑火灾善后工作
11月28日,香港上海汇丰银行有限公司及恒生银行(恒生)宣布首笔捐款3000万港元,支援香港宏福苑火灾受灾居民及家庭的救援及善后工作
2025-12-01 13:24:00
招商局集团捐款2000万港元援助香港救灾
11月27日,招商局集团发布公告称,针对香港大埔火灾,由招商局慈善基金会迅速拨出2000万港元设立专项慈善基金,用于应急救灾和灾后恢复等工作
2025-12-01 13:26:00
招商银行捐款1000万港元支援香港火灾善后
11月29日,招商银行发布公告称,香港新界大埔屋邨宏福苑多栋住宅楼发生火灾后,社会各界迅速行动、同心驰援。迅速启动应急金融服务机制
2025-12-01 13:30:00