• 我的订阅
  • 头条热搜
随着大模型的发展日新月异,其推理和训练的边界问题也引起了广泛讨论。近日,清程极智CEO汤雄超在一场行业活动中明确表示,尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限,但从技术角度来看,这两个阶段...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...数亿用户。 “草莓”模型为何重要?或重新定义AI能力边界,为GPT 5提供高质量合成训练数据OpenAI首席执行官奥特曼(Sam Altman)曾在今年早些时候表示,人工智能领域“最重要的进步方向将是推理能力”。而“草莓”项目被认...……更多
...模型,仍需强化学习技术。刘知远说,就推动大模型能力边界而言,“知识蒸馏”技术意义不大,未来仍需探索大规模强化学习技术,以持续激发大模型在思考、反思、探索等方面的能力。AI模型未来如何进化在2025年美国消费电...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...出了解决思路,而且还在编写完代码之后针对整体逻辑和边界条件进行了检查:把这个代码直接提交了一下,结果真的通过了。 国外网友也都称赞不已:中国公司的进步速度太快了!在推理中自我反思、纠正上海人工智能实验...……更多
...关系;通过概念延伸、条件明确、后果探讨、实务应用、边界探讨五大追问维度,构建了包含150万条数据的多轮对话数据集;通过多轮对话内容借助DeepSeek-R1构建得到深度思考数据集,使模型具备类法律人的思维路径。经统计,...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...诊断皮肤癌可以达到专业医生水平,但都是在需求明确、边界清晰、逻辑简单的前提下,也就是概念模型较为简单的前提下,人工智能可以利用算力优势超过人类,但当时人工智能在复杂逻辑推理、抽象概念理解上,还存在明显...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...能力的KRE(知识-推理-执行)三层架构,突破大模型能力边界。”徐立表示,“日日新SenseNova 5.0”(以下简称“日日新5.0”)采用混合专家架构(MoE),超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。本次更...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...算法。create 子句将节点(由后续坐标表示)添加到搜索边界中,close 子句将节点添加到该闭集。每个子句(create 或 close)后面都跟着 token x、y、c0 和 c1—— 分别表示节点的坐标、自开始以来的成本值和启发值。结构化轨迹丢弃...……更多
DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目
...语言模型在文档分析、代码生成、复杂推理等领域的应用边界。同时,NSA通过针对现代硬件的优化设计,在提高推理速度的同时、降低预训练成本,而不会牺牲性能。它在通用基准测试、长文本任务和基于指令的推理中均能达到...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...其实也在使用这两种学习方式?此外,当前大模型的能力边界到底在哪里?从推理和认知这两个能力维度出发,当一篇论文称大模型在一个评测指标上取得超出人类水平的结果时,我们是否应该感到恐慌?还是仔细审视在制定指...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...来两周内,OpenAI 是否能凭借「草莓」项目再次定义 AI 的边界,值得所有人拭目以待。9月6日-10日,IFA(柏林国际电子消费品展)2024 盛大开幕。联想、荣耀、TCL、海信、长虹、江波龙、时空壶、云鲸、追觅、极米、当贝、倍思、...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...证据:o1-preview 在关键越狱评估和用于评估模型安全拒绝边界的最严格内部基准上取得了显著的改进。OpenAI 认为,使用思维链可以为安全和对齐带来重大进步,因为 1)它能够以清晰的方式观察模型思维,并且 2)关于安全规则...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...型进行了训练,并使用掩码来确保自注意力不会跨越文档边界。2)训练数据Meta 表示,要训练出最佳的语言模型,最重要的是策划一个大型、高质量的训练数据集。据介绍,Llama 3 在超过 15T 的 token 上进行了预训练,训练数据集...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...、领先的技术实力和创新的产品应用,不断拓展AI技术的边界,携手合作伙伴共同开启AGI时代的新篇章,开启AGI时代的辉煌未来! ……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
OpenAI直播第二弹!奥特曼2024年最大惊喜竟来自字节?强化微调让o1-mini逆袭o1
...a计划,会让更多人在最重要的任务上,推动o1模型能力的边界。直播最后,依然是OpenAI式的圣诞冷笑话一则——最近,圣诞老人在尝试制造一辆无人驾驶雪橇,但不知为何,他的模型总是无法识别树木,导致雪橇不停地撞上道路...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
...测中,它的综合能力逼近当时的顶尖大模型,尤其在逻辑推理和数学题上展现出强劲性能,而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的,是它在训练方式上的简化。以往的模型在提升推理能力时,通常依...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini
...快科技4月30日消息,小米官方今天正式宣布,开源首个为推理(Reasoning)而生的大模型——Xiaomi MiMo。据介绍,Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...于很难找到能击溃模型的合适prompt,进行性能比较并查看边界情况。比较模型的其中一个好办法就是进行多轮RLHF。每次上传新模型时,只需在所有带标注的prompt上进行采样,让新旧模型分别回答,再自动计算胜率。Llama 4与AgentMe...……更多
提质降价,国产大模型加速奔跑
...态统一,持续突破人工智能感知、理解和推理世界的能力边界。这些,拓展着大模型与各行各业融合的深度和广度。“如今,芯片制造商、数据供应商、模型研发企业、应用开发商等方面协同合作正日益增强,共同创造全新应用...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...-D扁平化tile标签: , , ..., ,3)2-D网格标签: , , ..., ,4)2-D边界框标签: (x0, y0), (x1, y1) , ..., (xW, yH), (xW+1, yH+1) ,其中两个坐标分别为(左, 顶部),(右, 底部)。从消融实验结果中可以观察到:1)……更多
推动大模型自我进化,北理工推出「流星雨计划」
...我进化的方式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监……更多
京东云:智能体大规模“上岗”,企业深度应用正当时
...更协同的生态理念为引领,不断拓展和深化大模型技术的边界与应用。同时,凭借在京东内部场景千锤百炼的深度应用经验,打造出的极致性能、极致性价比的技术与产品,助力更多企业重塑AI生产力。本网站上的内容(包括但...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...小尺寸版o1-mini。OpenAI官方发文称,新模型旨在解决复杂推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程:首先将输入语音内容转换为文本,其次利用大语言模型进行文本推理,最后利用...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...工作——这些工作都需要复杂的运算,也依赖于模型能力边界的不断拓展。阿里云在会上也请了不少开发者、企业介绍已有的模型实践。比如华东理工大学的X-D Lab,及基于基于开源的通义千问开源模型开发了心理健康大模型MindC...……更多
更多关于科技的资讯:
联通客户日 暖冬送温情——福建联通VIP客户答谢会在三明圆满落幕
活动现场。东南网11月26日讯(通讯员 肖锦雯)近日,以“联通客户日 暖冬回馈季”为主题的福建联通VIP客户答谢会在三明市徐锦新城小区温馨启幕
2025-11-26 12:50:00
梦百合家居董事长倪张根亮相沈阳“梦粉见面会”,发布适老化智能床新品
近日,知名睡眠品牌MLILY 梦百合在沈阳京东MALL发布适老化智能床系列新品,并针对沈阳大东区社会福利院展开公益捐赠
2025-11-26 13:04:00
BORCHERS®亮相中国国际涂料展,以本地化创新与全球技术推动行业可持续发展
在今天开幕的 2025 中国国际涂料展上,美利肯涂料添加剂品牌BORCHERS®于 W2.F21 展位(展馆 W2)再次携核心解决方案亮相
2025-11-26 13:37:00
国际大咖为“南京故事”国际传播支招在中国制作 向世界传播南报网讯(记者乔雅萱)11月22日上午,南京国际传播中心揭牌仪式现场
2025-11-26 10:27:00
江苏南京:链接全球资本!宁企赴港上市热潮涌动
□南京日报/紫金山新闻记者曹丽珍今年以来,一股赴港上市浪潮正在全国范围内持续奔涌。相关数据显示,今年前三季度,中国企业境外首次公开募股(IPO)的活跃度大幅回升
2025-11-26 10:27:00
江苏南京:一张购物小票,掘出一座“数据金山”
南京加快释放数据要素价值培育壮大数据产业一张购物小票,掘出一座“数据金山”晓数通社区微数据中心。 江苏荣泽信息科技股份有限公司供图数族科技
2025-11-26 10:27:00
南报网讯(记者朱旖旎通讯员刘芳)深秋的南京,一场跨越山海的双向奔赴正在发生。近日,2025中欧机器人产业合作(南京)对接会在栖霞区召开
2025-11-26 10:28:00
医疗器械“产学研医”对接会举办
近日,2025南京医疗器械“产学研医”对接会在高淳举办,高校、医院、企业等多方代表齐聚。活动搭建协同平台,助力产业创新与成果转化
2025-11-26 10:28:00
在长三角文博会上亮出“文化家底”和数字创新实力南京打造微短剧产业集聚高地□南京日报/紫金山新闻记者朱静近日,一场聚焦微短剧的产业合作交流活动在国家会展中心(上海)火热举办
2025-11-26 10:28:00
江苏南京:相约十年,让制造更聪明
相约十年,让制造更聪明——写在2025世界智能制造大会即将召开之际□南京日报/紫金山新闻记者徐宁 实习生黄倩“作为南京智能制造产业的标杆力量
2025-11-26 10:28:00
智能工厂运营效率提升
近日,在南京天加环境科技有限公司今年5月投产的天加洁净基地内,高度自动化生产线正生产发泡板机、换热器等核心零部件。该生产基地建立了从客户需求到最终交付的“端到端”全流程数字化运营体系
2025-11-26 10:28:00
东南网11月26日讯(福建日报记者 李珂) 记者从厦门大学获悉,日前,该校萨本栋微米纳米科学技术研究院吴德志教授团队在3D打印技术领域取得突破性进展——首创“激光原位诱导直写打印”技术
2025-11-26 10:34:00
厦门网讯(厦门日报记者 张珺 通讯员 吴冰冰)我市跨境电商生态再添新支点,日前,POD(按需定制)专卖孵化平台公司正式落户银城智谷海熹跨境电商产业园
2025-11-25 08:11:00
AI赋能千行百业一线故事(十七):这位“农事专家”,让种地更聪明
这位“农事专家”,让种地更聪明——AI赋能千行百业一线故事(十七)11月14日,雄安新区都市农业科技博览园温室大棚内,工作人员查看番茄长势
2025-11-25 08:41:00
荣耀加冕!锦程酒管多店荣登消费者喜爱榜-2025年中国高端酒店100强
2025 年 11 月 20 日-21日—— 在备受文旅与酒店行业瞩目的 “2025 迈点文旅节・第七届迈点酒店运营创新大会” 上
2025-11-25 09:25:00