• 我的订阅
  • 头条热搜
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩De...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...息时可能出现的错误回答,以及在涉及安全问题的多模态推理中出现误判。尽管模型可以正确识别图中的酒水,但在进一步的推理中,部分模型并不能意识到其与头孢药物共用的潜在风险。图7 模型在涉及安全问题的推理中出现...……更多
京东云曹鹏:AI变革之下,大模型技术如何为企业未来赋能?
...提高工作效率;在模型服务方面,提供一站式的模型训练推理服务,降低大模型训练和使用门槛;在基础设施方面,提供极致的数字基础设施能力,满足大模型的算力需求。随着通用大模型训练进入万亿参数级别,超大规模算力...……更多
腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%
...评腾讯Angel机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。据了解,突破主要在通信、效率、规模三方面实现。通信:从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了集群高速互联,单...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...本质的不同。其不仅进入到复杂的领域,还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果,二者差异显著,其中,前者正确解决问题的准确率是 13.4%,而 o1 的准确率...……更多
零一万物新模型盲测国产首超GPT-4o!李开复透露:一次训练成本超2000万
...消息称,国内大模型头部企业中有几家放弃预训练、转向推理端,对此李开复表示,不会放弃预训练,但这是个技术活,需要懂芯片、推理、模型、算法。李开复称,目前国内头部六家大模型企业融资额度都是够的,一次预训练...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...率基础上,并通过改进视觉指令数据集和SGLang,提升了“推理、OCR等方面的性能”,意味着人类向AGI(通用人工智能)探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文 二、更适合中国人体质的GPT-4V...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...较长的小说了。更重要的是,LLM真的能在这个长度上进行推理吗?近日,有两篇独立研究分别表明:长上下文水分很大!LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员,推出了一项针对性...……更多
OpenAI CEO承认了!DeepSeek非常棒 不会起诉
...了业界对于“AI算力需求”的看法。特别是DeepSeek推出的推理大模型DeepSeek-R1,其不仅性能比肩OpenAI o1 ,并且其所需的训练成本可能只有后者的约1/20(仅用了2048 个 H800 GPU,花了两个月的时间训练完成,仅花费了约558万美元),AP...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接...……更多
...,Seed Edge初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。尽管业界不少团队在讨论是否应对AI预训练和基础研究继续...……更多
硬件在人工智能基础教育中的角色: 机遇和挑战
...础,当前研究主要还是侧重于深度神经网络的结构和能力边界的探究。深度神经网络的研究重点主要集中在数据处理方法、神经元架构以及联结方式(特别是近期对大数据模型如transformer和Mamba架构的研究),以及网络训练方法...……更多
...的飞跃,就无法进入家庭领域,而Helix模型能像人类一样推理。据Figure AI介绍,Helix不仅实现了对整个机器人的上半身,包括手腕、躯干、头部和单个手指输出高速率连续控制,也可以在两台机器人上同时运行,使它们能够解决...……更多
不用部署,实现大模型切换自由!Token、算力免费薅!
...可以通过页面底部的对话框对已处于启动状态的模型进行推理实测。如果频道中暂时没有处于启动状态的公共线路,您可以选择心仪的线路并一键启动。如何实现模型 API 切换自由?如所选模型实测频道的免费公共线路已处于启...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...精度,还显著降低了计算负担,完美解决了时序大模型在推理阶段的计算瓶颈。2. 灵活的预测范围:Time-MoE支持任意长度的输入和输出范围,能够处理从短期到长期的各种时序预测任务,实现了真正的全域时序预测。3. 全球最大...……更多
...模型已与华为昇腾AI基础软硬件完成适配:支持Atlas300Ipro推理卡,具备int8量化能力;支持Atlas训练服务器,用户可使用昇思MindSpore和PyTorch框架进行模型训练和推理。 ……更多
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
...单的预定义场景,无法复制人类用来推断心理状态的复杂推理。ExploreToM 框架ExploreToM 通过生成多样化、可扩展的对抗性数据集,为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性,以及高质量训练数据对于...……更多
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...其不断交互才能变得聪明,待在实验室里并不会造福世界推理是下一个重要的进步节点,能提升数据训练效率,产生更有价值的结果对话实录部分要点整理Transformer因何横空出世?Illia Polosukhin:如果要做出能真正读取搜索结果的...……更多
文心大模型赋能千行百业,自主进化
...,文心大模型3.5还新增了插件机制,扩增了大模型的能力边界。10月17日,百度世界2023大会上,李彦宏宣布文心大模型4.0正式发布。文心大模型4.0是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻...……更多
海信星海大模型接入DeepSeek
...矩阵,将通过模型蒸馏、强化学习等技术提升深度思考与推理能力,使得海信AI电视能够更准确地理解用户深层的意图和需求,为用户提供更流畅、更简单、更自然的交互与服务体验。海信电视正在进行用户终端的升级发布,预...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...务设定多个小模型,并提供不同的参数训练,端到端减少推理成本。另外,将专用小 GPU 芯片置入到机器人中,也可提高任务实时性,目前特斯拉已在自动驾驶中尝试了这种做法。硬氪:今年有哪些细分场景的模型值得关注?王...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 DiT(扩散 Transformer)...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...验结果发现,Movie Gen Video模型能够理解物理世界——可以推理物体运动、主-客体交互、几何关系、相机运动、物理规律,以及各种概念的合理运动。在微调阶段,研究人员精选了一部分视频,对模型在美学、运动质量方面完成...……更多
面壁智能的端侧大模型面壁MiniCPM正式亮相
...大的底层支撑,先是算力方面,凭借全流程高效infra10倍推理加速,能够将成本降低90%;其次在算法方面,面壁模型通过高效模型训练配置实现模型能力快速形成;数据处理方面,凭借现代化数据工厂形成从数据治理到多维评测...……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力需求每3~4个月就翻一番,每年训练AI模型所需算力增幅高达10倍,而生成式AI使上升曲线进一步陡峭,未来大模型...……更多
算力直降97%,GPT-3存储只用20MB?!这篇新论文火了
...开始,作者提到前人研究已经表明,大语言模型(LLM)的推理可以在1.58-bit精度下进行,且不会有任何性能损失。比如下面这篇论文,有人引入了1-bit的LLM变体(即BitNet b1.58),其中LLM的每个参数或权重都是三元的{-1, 0, 1}。它在...……更多
阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误
快科技1月16日消息,今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。据了解,在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时...……更多
...超2.5倍,年均复合增速近40%。二是算力结构的显著变化,推理算力需求将超过训练算力需求,未来3年,推理算力年复合增速将达到训练算力的近4倍,到2028年,推理算力规模将超过训练算力规模。这一进程将给算网发展注入新的...……更多
百度发布深度思考大模型文心X1:性能对标R1,API调用价格减半
...百度首个原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升,在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调用价格约为R1的一半。百度方面表示,作...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...术分享直播活动的最后一天!周五,OpenAI发布了下一代的推理模型o3,这是今年早些时候发布的o1推理模型的升级版本。更准确地说,o3是一个模型系列——就像o1一样,同时有o3和o3-mini两个版本,后者是一款更小的精简版模型,...……更多
更多关于财经的资讯:
· 2025年我国油、气产量双创历史新高
新华社北京12月15日电(记者王悦阳)记者15日从2026年全国能源工作会议获悉,2025年我国油、气产量双创历史新高
2025-12-16 08:30:00
48股12月以来获杠杆资金净买入逾3亿元
根据Wind数据统计,截至12月15日,12月以来已有1892股获杠杆资金净买入,其中,48股融资净买入额超过3亿元。从二级市场来看,顺灏股份、航天机电、西部材料、航天动力、航天
2025-12-16 09:43:00
贵州农商联合银行获准开业,茅台集团持股9.6%
近日,原贵州省农村信用社联合社发生工商变更,企业名称变更为贵州农村商业联合银行股份有限公司,新增贵州省财政厅、中国贵州茅台酒厂(集团)有限责任公司等为股东
2025-12-16 09:48:00
山东国资成立产投发展合伙企业,出资额70亿
近日,泰安市政金普惠产业投资发展合伙企业(有限合伙)成立,出资额70亿元,经营范围包含:以自有资金从事投资活动;企业管理咨询。企查查股权穿透显示,该企业由山东省普惠齐鲁投资有限公
2025-12-16 10:00:00
中航沈飞在海南成立飞机工程公司
近日,中航沈飞(海南)飞机工程有限公司成立,注册资本1.5亿元,经营范围包含:民用航空器维修;民用航空维修人员培训;道路货物运输(不含危险货物)等。企查查股权穿透显示,该公司由中
2025-12-16 10:00:00
中建七局投资公司2025年度综合管理系统培训圆满收官
为深入践行砺进·共赢——“创新·实干·争先”企业文化精神,全面提升综合管理系统员工的综合素质与业务能力,更好地支撑公司战略发展
2025-12-16 10:48:00
幸福投资 从心开始,中建七局投资公司心理健康服务品牌4周年,温暖再启航!
四载耕耘,心光璀璨;万千关爱,幸福相伴。投资公司“幸福投资·从心开始”心理健康服务品牌迎来了四周岁生日!四年来,公司工会始终以职工需求为中心
2025-12-16 10:48:00
长沙银行拟斥资不超15.5亿元增资长银五八消费金融 强化控股地位
12月16日,长沙银行发布公告称,为增强控股子公司湖南长银五八消费金融股份有限公司(简称“长银五八”)的资本实力与风险抵御能力
2025-12-16 10:54:00
上海银行拟赎回“上银优1”优先股 12月18日起停牌
12月16日,上海银行(证券代码:601229)发布提示性公告,因拟赎回“上银优1”优先股,公司将对相关证券实施停牌。公告显示
2025-12-16 11:00:00
麦当劳回应涨价:15日起部分餐品价格增加0.5到1元
中新网12月15日电 (记者 吴家驹)12月15日,有网友发现,一些麦当劳餐品的价格有所上调。其中,麦当劳1+1随心配红区中的双层吉士汉堡涨价1元
2025-12-16 08:00:00
文旅科技融合、特色场景赋能 首发经济激活消费市场
今年以来,“首发经济”成为激活消费市场的重要引擎,各地因地制宜推出创新举措,持续释放内需潜力,为经济增长注入强劲动力。陕西西安将首发经济与文旅科技深度融合
2025-12-16 08:00:00
聚焦雄安新区|中国矿产资源集团在雄安注册成立全资子公司
河北日报讯(见习记者康晓博)12月5日,中国矿产资源集团(以下简称“中国矿产”)在河北雄安新区注册成立全资子公司——中国矿产资源集团国际铁矿石贸易有限公司
2025-12-16 08:04:00
工行无锡惠山支行5000万元贷款赋能制造业企业创新升级
近日,工行无锡惠山支行成功向某智能装备公司投放5000万元流动资金贷款,为企业技术迭代、产能扩张与海外市场拓展注入强劲金融动能
2025-12-15 15:22:00
中信银行盐城分行成功举办中信财富年度论坛
江南时报讯 岁末启新,谋势致远。12月7日,中信银行盐城分行成功牵头举办中信财富年度论坛,以“中信·让财富有温度”为核心主题
2025-12-15 15:22:00
金融“活水”赋能区域 郑州银行用高质量经营助力地方经济提质增效
大河网讯 在银行业整体面临息差收窄、竞争加剧的行业大环境下,区域性金融机构的经营韧性与服务实体能力愈发受到关注。作为深耕河南的本土法人银行
2025-12-15 15:22:00