边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

阿里通义发布最新开源推理模型，称其性能比肩DeepSeek-R1。3月6日凌晨，阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩De...……更多

2025-03-06 13:22:00阿里,推理,模型,性能,模型,通义

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...息时可能出现的错误回答，以及在涉及安全问题的多模态推理中出现误判。尽管模型可以正确识别图中的酒水，但在进一步的推理中，部分模型并不能意识到其与头孢药物共用的潜在风险。图7 模型在涉及安全问题的推理中出现...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

京东云曹鹏：AI变革之下，大模型技术如何为企业未来赋能？

...提高工作效率；在模型服务方面，提供一站式的模型训练推理服务，降低大模型训练和使用门槛；在基础设施方面，提供极致的数字基础设施能力，满足大模型的算力需求。随着通用大模型训练进入万亿参数级别，超大规模算力...……更多

2024-07-31 11:34:00京东,变革,模型,技术,企业,京东

腾讯Angel获世界互联网大会领先科技奖：让通信成本降低70

...评腾讯Angel机器学习平台：突破万亿级模型分布式训练和推理以及大规模应用部署等难题。据了解，突破主要在通信、效率、规模三方面实现。通信：从网卡到交换机，再到路由协议，腾讯自研的RDMA网络实现了集群高速互联，单...……更多

2024-11-21 09:55:00科技奖,腾讯,成本,领先,大会,互联网

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...本质的不同。其不仅进入到复杂的领域，还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

零一万物新模型盲测国产首超GPT-4o！李开复透露：一次训练

...消息称，国内大模型头部企业中有几家放弃预训练、转向推理端，对此李开复表示，不会放弃预训练，但这是个技术活，需要懂芯片、推理、模型、算法。李开复称，目前国内头部六家大模型企业融资额度都是够的，一次预训练...……更多

2024-10-17 16:49:00李开复,万物,模型,国产,成本,训练

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...率基础上，并通过改进视觉指令数据集和SGLang，提升了“推理、OCR等方面的性能”，意味着人类向AGI（通用人工智能）探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文二、更适合中国人体质的GPT-4V...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...较长的小说了。更重要的是，LLM真的能在这个长度上进行推理吗？近日，有两篇独立研究分别表明：长上下文水分很大！LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员，推出了一项针对性...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

OpenAI CEO承认了！DeepSeek非常棒不会起诉

...了业界对于“AI算力需求”的看法。特别是DeepSeek推出的推理大模型DeepSeek-R1，其不仅性能比肩OpenAI o1 ，并且其所需的训练成本可能只有后者的约1/20（仅用了2048 个 H800 GPU，花了两个月的时间训练完成，仅花费了约558万美元），AP...……更多

2025-02-04 13:41:00软银,奥尔,奥尔特曼,模型,特曼,日本

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

字节启动AGI长期研究计划代号Seed Edge

...，Seed Edge初步确定了五大研究方向，包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。尽管业界不少团队在讨论是否应对AI预训练和基础研究继续...……更多

2025-01-23 09:51:00代号,字节,研究,研究,团队,豆包

硬件在人工智能基础教育中的角色: 机遇和挑战

...础，当前研究主要还是侧重于深度神经网络的结构和能力边界的探究。深度神经网络的研究重点主要集中在数据处理方法、神经元架构以及联结方式（特别是近期对大数据模型如transformer和Mamba架构的研究），以及网络训练方法...……更多

2024-06-26 14:45:00人工智能,人工,机遇,角色,硬件,智能

Figure AI发布人形机器人通用大模型：能识别陌生物品，

...的飞跃，就无法进入家庭领域，而Helix模型能像人类一样推理。据Figure AI介绍，Helix不仅实现了对整个机器人的上半身，包括手腕、躯干、头部和单个手指输出高速率连续控制，也可以在两台机器人上同时运行，使它们能够解决...……更多

2025-02-21 12:11:00机器人,机器,人形,模型,运行,物品

不用部署，实现大模型切换自由！Token、算力免费薅！

...可以通过页面底部的对话框对已处于启动状态的模型进行推理实测。如果频道中暂时没有处于启动状态的公共线路，您可以选择心仪的线路并一键启动。如何实现模型 API 切换自由？如所选模型实测频道的免费公共线路已处于启...……更多

2024-08-14 09:39:00切换,模型,不用,自由,模型,清湛

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...精度，还显著降低了计算负担，完美解决了时序大模型在推理阶段的计算瓶颈。2. 灵活的预测范围：Time-MoE支持任意长度的输入和输出范围，能够处理从短期到长期的各种时序预测任务，实现了真正的全域时序预测。3. 全球最大...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

中国电信开源星辰语义大模型，开放1t清洗数据集

...模型已与华为昇腾AI基础软硬件完成适配：支持Atlas300Ipro推理卡，具备int8量化能力；支持Atlas训练服务器，用户可使用昇思MindSpore和PyTorch框架进行模型训练和推理。 ……更多

2024-01-14 09:52:00中国电信,语义,中国,星辰,清洗,模型

AI 的“心智理论”难题：Meta ExploreToM 探

...单的预定义场景，无法复制人类用来推断心理状态的复杂推理。ExploreToM 框架ExploreToM 通过生成多样化、可扩展的对抗性数据集，为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性，以及高质量训练数据对于...……更多

2024-12-21 09:27:00之路,心智,难题,突破,理论,模型

黄仁勋对话Transformer七子：我们被困在原始模型里，

...其不断交互才能变得聪明，待在实验室里并不会造福世界推理是下一个重要的进步节点，能提升数据训练效率，产生更有价值的结果对话实录部分要点整理Transformer因何横空出世？Illia Polosukhin：如果要做出能真正读取搜索结果的...……更多

2024-03-22 00:03:00架构,模型,对话,模型,数据,资源

文心大模型赋能千行百业，自主进化

...，文心大模型3.5还新增了插件机制，扩增了大模型的能力边界。10月17日，百度世界2023大会上，李彦宏宣布文心大模型4.0正式发布。文心大模型4.0是迄今为止最强大的文心大模型，实现了基础模型的全面升级，在理解、生成、逻...……更多

2023-11-19 12:55:00文心,百业,进化,模型,模型,文心

海信星海大模型接入DeepSeek

...矩阵，将通过模型蒸馏、强化学习等技术提升深度思考与推理能力，使得海信AI电视能够更准确地理解用户深层的意图和需求，为用户提供更流畅、更简单、更自然的交互与服务体验。海信电视正在进行用户终端的升级发布，预...……更多

2025-02-13 16:06:00海信,星海,接入,模型,海信,模型

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...务设定多个小模型，并提供不同的参数训练，端到端减少推理成本。另外，将专用小 GPU 芯片置入到机器人中，也可提高任务实时性，目前特斯拉已在自动驾驶中尝试了这种做法。硬氪：今年有哪些细分场景的模型值得关注？王...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

AI出图更快、更懂你心意，高美感文生图模型修炼了哪些技术秘籍

...等工具如何为部署模型提供支持，助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解，细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火，也带火了背后的 DiT（扩散 Transformer）...……更多

2024-08-13 09:39:00文生,出图,美感,秘籍,心意,更快

Meta版Sora深夜横空出世，小扎放出16秒高清大片！92

...验结果发现，Movie Gen Video模型能够理解物理世界——可以推理物体运动、主-客体交互、几何关系、相机运动、物理规律，以及各种概念的合理运动。在微调阶段，研究人员精选了一部分视频，对模型在美学、运动质量方面完成...……更多

2024-10-08 09:52:00高清,架构,大片,细节,论文,技术

面壁智能的端侧大模型面壁MiniCPM正式亮相

...大的底层支撑，先是算力方面，凭借全流程高效infra10倍推理加速，能够将成本降低90%；其次在算法方面，面壁模型通过高效模型训练配置实现模型能力快速形成；数据处理方面，凭借现代化数据工厂形成从数据治理到多维评测...……更多

2024-02-01 21:36:00模型,智能,模型,智能,用户,数据

从0到1：国产化千卡集群的一小步，AI算力主动权的一大步

...紧张是产生算力焦虑的根源所在。一方面，大模型训练与推理需求呈几何级数爆发——自2022年以来，人工智能算力需求每3~4个月就翻一番，每年训练AI模型所需算力增幅高达10倍，而生成式AI使上升曲线进一步陡峭，未来大模型...……更多

2024-04-28 11:52:00小步,主动权,集群,大步,主动,国产

算力直降97%，GPT-3存储只用20MB？！这篇新论文火了

...开始，作者提到前人研究已经表明，大语言模型（LLM）的推理可以在1.58-bit精度下进行，且不会有任何性能损失。比如下面这篇论文，有人引入了1-bit的LLM变体（即BitNet b1.58），其中LLM的每个参数或权重都是三元的{-1, 0, 1}。它在...……更多

2024-12-30 09:11:00文火,新论,存储,训练,小哥,模型

阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o

快科技1月16日消息，今日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。据了解，在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时...……更多

2025-01-16 14:56:00通义,阿里,推理,模型,尺寸,奖励

中国移动董事长杨杰：由云向智，共绘算网新生态

...超2.5倍，年均复合增速近40%。二是算力结构的显著变化，推理算力需求将超过训练算力需求，未来3年，推理算力年复合增速将达到训练算力的近4倍，到2028年，推理算力规模将超过训练算力规模。这一进程将给算网发展注入新的...……更多

2025-04-11 10:38:00杨杰,中国,中国移动,董事长,董事,生态

百度发布深度思考大模型文心X1：性能对标R1，API调用价格

...百度首个原生多模态大模型，其多模态理解、文本和逻辑推理能力显著提升，在多项测试中表现优于GPT4.5，API调用价格仅为GPT4.5的1%；文心大模型X1为深度思考模型，性能对标DeepSeek-R1，调用价格约为R1的一半。百度方面表示，作...……更多

2025-03-16 11:07:00文心,深度,模型,性能,价格,文心

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

...术分享直播活动的最后一天！周五，OpenAI发布了下一代的推理模型o3，这是今年早些时候发布的o1推理模型的升级版本。更准确地说，o3是一个模型系列——就像o1一样，同时有o3和o3-mini两个版本，后者是一款更小的精简版模型，...……更多

2024-12-21 17:02:00下一代,推理,模型,直播,模型,推理

page 12/1334 首页上一页 7 8 9 10 111213 14 15 16 17 下一页末页

更多关于财经的资讯：

· 2025年我国油、气产量双创历史新高

新华社北京12月15日电（记者王悦阳）记者15日从2026年全国能源工作会议获悉，2025年我国油、气产量双创历史新高

2025-12-16 08:30:00

48股12月以来获杠杆资金净买入逾3亿元

根据Wind数据统计，截至12月15日，12月以来已有1892股获杠杆资金净买入，其中，48股融资净买入额超过3亿元。从二级市场来看，顺灏股份、航天机电、西部材料、航天动力、航天

2025-12-16 09:43:00

贵州农商联合银行获准开业，茅台集团持股9.6%

近日，原贵州省农村信用社联合社发生工商变更，企业名称变更为贵州农村商业联合银行股份有限公司，新增贵州省财政厅、中国贵州茅台酒厂（集团）有限责任公司等为股东

2025-12-16 09:48:00

山东国资成立产投发展合伙企业，出资额70亿

近日，泰安市政金普惠产业投资发展合伙企业（有限合伙）成立，出资额70亿元，经营范围包含：以自有资金从事投资活动；企业管理咨询。企查查股权穿透显示，该企业由山东省普惠齐鲁投资有限公

2025-12-16 10:00:00

中航沈飞在海南成立飞机工程公司

近日，中航沈飞（海南）飞机工程有限公司成立，注册资本1.5亿元，经营范围包含：民用航空器维修；民用航空维修人员培训；道路货物运输（不含危险货物）等。企查查股权穿透显示，该公司由中

2025-12-16 10:00:00

中建七局投资公司2025年度综合管理系统培训圆满收官

为深入践行砺进·共赢——“创新·实干·争先”企业文化精神，全面提升综合管理系统员工的综合素质与业务能力，更好地支撑公司战略发展

2025-12-16 10:48:00

幸福投资从心开始，中建七局投资公司心理健康服务品牌4周年，

四载耕耘，心光璀璨；万千关爱，幸福相伴。投资公司“幸福投资·从心开始”心理健康服务品牌迎来了四周岁生日！四年来，公司工会始终以职工需求为中心

2025-12-16 10:48:00

长沙银行拟斥资不超15.5亿元增资长银五八消费金融强化控股

12月16日，长沙银行发布公告称，为增强控股子公司湖南长银五八消费金融股份有限公司（简称“长银五八”）的资本实力与风险抵御能力

2025-12-16 10:54:00

上海银行拟赎回“上银优1”优先股 12月18日起停牌

12月16日，上海银行（证券代码：601229）发布提示性公告，因拟赎回“上银优1”优先股，公司将对相关证券实施停牌。公告显示

2025-12-16 11:00:00

麦当劳回应涨价：15日起部分餐品价格增加0.5到1元

中新网12月15日电 (记者吴家驹)12月15日，有网友发现，一些麦当劳餐品的价格有所上调。其中，麦当劳1+1随心配红区中的双层吉士汉堡涨价1元

2025-12-16 08:00:00

文旅科技融合、特色场景赋能首发经济激活消费市场

今年以来，“首发经济”成为激活消费市场的重要引擎，各地因地制宜推出创新举措，持续释放内需潜力，为经济增长注入强劲动力。陕西西安将首发经济与文旅科技深度融合

2025-12-16 08:00:00

聚焦雄安新区｜中国矿产资源集团在雄安注册成立全资子公司

河北日报讯（见习记者康晓博）12月5日，中国矿产资源集团（以下简称“中国矿产”）在河北雄安新区注册成立全资子公司——中国矿产资源集团国际铁矿石贸易有限公司

2025-12-16 08:04:00

工行无锡惠山支行5000万元贷款赋能制造业企业创新升级

近日，工行无锡惠山支行成功向某智能装备公司投放5000万元流动资金贷款，为企业技术迭代、产能扩张与海外市场拓展注入强劲金融动能

2025-12-15 15:22:00

中信银行盐城分行成功举办中信财富年度论坛

江南时报讯岁末启新，谋势致远。12月7日，中信银行盐城分行成功牵头举办中信财富年度论坛，以“中信·让财富有温度”为核心主题

2025-12-15 15:22:00

金融“活水”赋能区域郑州银行用高质量经营助力地方经济提质增

大河网讯在银行业整体面临息差收窄、竞争加剧的行业大环境下，区域性金融机构的经营韧性与服务实体能力愈发受到关注。作为深耕河南的本土法人银行

2025-12-15 15:22:00

头条订阅服务