• 我的订阅
  • 头条热搜
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
伏羲大模型亮相:人工智能助力解决次季节和极端天气预测难题
...数学公式“发愁”。漆远介绍道,这类模型首先需要接受训练,即识别大量历史气象数据中的模式。当接收到最新气象数据时,人工智能天气模型通过应用从历史模式中习得的知识来完成预测。该过程的计算强度要小得多,并且...……更多
冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%
...以上是来自EPFL机构研究人员的最新发现,在当前LLM拒绝训练方法中,存在一个奇怪的泛化差异:仅仅将有害的请求改写成过去时态,通常就足以破解许多领先的大模型的安全限制。论文地址:https://arxiv.org/pdf/2407.11969值得一提的...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
...种可控制动作、可玩的 3D 环境,而这些 3D 环境又可用于训练和评估具身智能体。DeepMind 表示,Genie 2 只需使用单张提示图像,就能生成可供人类或 AI 智能使用键鼠输入游玩的环境。我们知道,在 AI 研究领域,游戏扮演着一个重...……更多
提质降价,国产大模型加速奔跑
...化数据,关注数据与实际场景的一致性和配适性;三是在训练过程中找到最优的调试参数。李景秋说,依托大模型强大的能力,百度智能云千帆平台开始与更多行业和企业进行合作。比如,在教育领域,借助大模型,“考试宝”...……更多
致敬浪潮“她”力量丨成功秘诀?不过是把“我能行”,用代码写了千万遍
...多路召回和重排序机制提升检索效果;有人建议采用对抗训练方法,增强模型的推理和答案选择能力;还有人提出优化模型融合和选择策略,通过融合多种结构不同的模型提升准确率。”在无数次激烈的思维碰撞以及训练优化中...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...增强方法由于其缓解过拟合的特性,而被广泛使用在模型训练过程中,例如图像的旋转、缩放、颜色的改变等等。然而,美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个重要属性,色调(Hue)的变化却在现...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...的 LLM 无法进行真正的逻辑推理;相反,它们试图复制在训练数据中观察到的推理步骤」。然而,事实真的是这样吗?谷歌 DeepMind 的一篇论文似乎得出了相反的结论。最近,DeepMind 今年 2 月份的一篇论文在社交媒体上掀起了一些...……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...问题,ProcessPainter 通过在合成数据和人类画师绘画视频上训练时序模型,首次实现了让扩散模型生成绘画过程。此外,不同题材、画师的绘画过程差异巨大,风格迥异。然而,目前很少有研究将绘画过程作为研究对象。论文作者...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...型的推理速度。为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关的研究每天都有,但自己训练大尺寸Mamba模型的却很少。目前比较有名的是AI21的Jamba(进化到了1.5版本,最大398B,MoE...……更多
...特征?黄艾舟:大模型需要大量的数据,底层有很多语料训练才能涌现出推理能力。金融业是对于数据安全和数据隐私保护最为重视的一个行业之一,所以开展大模型的探索,可能会存在一定的困难。目前各银行对于大模型的应...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...重要6 通过规划、纠错,o1能够解决世界上的新问题7 新的训练范式是一种全新的方法,可以将更多的算力投入到模型中8 o1编写代码时,当其输出要使用的代码时,需要通过单元测试接下来,具体来看下o1模型背后的故事。强化学...……更多
智能驾驶的「 ChatCPT 时刻」,这么近,那么远
...斯拉的更新日志,采用端到端的 FSDV12 经过数百万个视频训练后,可以减少 30 多万行 C++代码,仅保留了 3000 行代码。当然,上边说的都最理想状态的端到端,现实中,目前被各家车企、自动驾驶供应商宣传的端到端,并没有那...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...语形式流传,缺乏对应文字,并且难以收集,可用于模型训练的方言语料数据偏少。信也科技算法科学家倪博溢。10月24日,第八届信也科技杯算法大赛总决赛上,9支人工智能队伍角逐,探索利用AI技术识别和还原语音数据中的...……更多
旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包
...生成领域,许多工作通常使用高质量的闭源自采数据进行训练,以追求更好的效果。而旷视研究院始终坚持全面开源,确保实际效果的可复现性。MegActor 的训练数据全部来自公开可获取的开源数据集,配合开源代码,使得感兴趣...……更多
...星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...提高时空数据预测的准确性,但这些方法通常需要大量的训练数据来生成可靠的时空特征。然而,在实际的城市监测场景中,数据往往不足,特别是在某些情况下,收集有标记的数据变得非常困难,这进一步加剧了挑战。因此,...……更多
AI “早筛” 癌症,准确区分13种癌症,准确率98.2%,人类尽早治疗癌症还远吗?
...疗。日前,来自伦敦帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET,通过观察 DNA 甲基化模式,从非癌组织中识别出 13 种不同类型的癌症(包括乳腺癌、肝癌、肺癌和前列腺癌等),准确率高达 98.2%...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...门控模型控制专家模型的选择和加权混合。简言之,MoE在训练过程通过门控模型实现“因材施教”,进而在推理过程实现专家模型之间的“博采众长”。 图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化,在模型研...……更多
类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
...模型是否准确?它能否泛化到新的情况,即那些不仅仅是训练数据插值的情形?这些问题至关重要,决定了生成图像的应用范围 —— 是仅限于媒体生产,还是可以用作现实世界的可靠模拟。最后他指出,不能简单地通过拟合大...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
... 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。在最近关于「Scaling Law 是否撞墙」的讨论中,后训练(post-training)被寄予厚望。众所周知,近期发布的 OpenAI o1 在数学、 代码、长程规划等问题上取得了显...……更多
提升开户效率、控制合规风险,大模型助力券商提质增效
...佳;长文提取关键字段信息难,段落之间没有关联关系;训练样本需求庞大,训练时间长等。 北京商报记者了解到,腾讯云TI-OCR平台通过搭载大模型能力,有效解决了图像干扰、混合版式、表格结构化识别等OCR领域核心痛点。...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段。后者不仅依赖昂贵的人工标注数据,而且很可能让人类水平限制LLM的进一步发展。今年1月,Meta和NYU的团队就提出了语言模型的...……更多
北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉
...人员重点攻关此技术方向,还投入大量算力资源支持模型训练和实验。该团队近期将发布新的 VAR T2I 模型研究成果,并将对模型开源。二是由新加坡国立大学、 Sea AI Lab 研究者共同完成的《Stochastic Taylor Derivative Estimator: Efficient ……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...研究领域,但现有的模型要么在仅包含语音的数据上进行训练,要么是关注特定任务,如文本转语音(TTS)、自动语音识别(ASR)或翻译,在其他模态数据和任务上的泛化能力十分有限。在大型语言模型(LLM)性能不断提升的情...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...源。MMedBench 上的准确率,图 d 展⽰了在 MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为 MMedC。该数据集包含 255 亿 token...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...,生成合理的推理过程,并将这些推理融入到其强化学习训练过程中。强化学习技术能够显著提升模型解决复杂问题的能力,尤其是在 o1 所采用的细粒度奖励机制的加持下。这种奖励机制为模型的每一步推理提供细粒度的反馈...……更多
小语种国家如何拥抱AI 全球专家论道WAIC
...已促成与中国AI同行的合作,通过HuGME评估框架实现了从训练、语料建设到实际应用的完整闭环。每一种语言都应有属于自己的大模型塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授表示,塞尔维亚语在通用模型中token占比...……更多
遗憾不?百度早研究过Scaling Law,Anthropic CEO灵感都来自百度
...实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可预测的幂律 scaling 关系。只是,他们当时用的是 LSTM,而非 Transformer,也没有将相关发现命名为「Scaling Law」。在追求 AGI 的道路上,Scaling Law ...……更多
...数据通过人工方式生成,而不是从真实世界中获取,用于训练大模型。“我用过一些国产基座大模型,它们的效果和GPT-4比起来,还是有一定差距。”赵海教授告诉记者,“但使用DeepSeek-V3后,我发现它的性能与GPT-4处于同一量级...……更多
更多关于科技的资讯:
在杭州城西科创大走廊东首的西湖区紫金港科技城云谷中心,国内最大模型开源社区“魔搭社区”的首个线下实体空间——魔搭社区(杭州)开发者中心(以下简称“开发者中心”)
2025-12-05 08:13:00
眼下,养宠群体逐渐壮大,带来的刚需消费、悦己消费持续升温、充满潜力,宠物经济迅速崛起。最近,省农业农村厅联合省发改委、省商务厅等五部门印发《关于促进宠物经济发展的意见》
2025-12-05 08:13:00
海运到货 福州车厘子上新整体售价稳步回落4日,随着海运而来的智利车厘子到达福州,福州市场上车厘子全面上新,整体售价开始稳步回落
2025-12-05 08:13:00
苏州作为全国数字经济、数字金融的先行城市,始终以敢为人先的魄力,争当保险科技应用的“试验场”与“示范区”。苏州市数字金融高质量发展大会保险科技专题活动在苏州人保财险成功举办
2025-12-05 10:56:00
近日,2025系统医学与健康大会在苏州工业园区举行,四大慢病国家科技重大专项技术总师陈竺,创新药物研发国家科技重大专项技术总师曹雪涛
2025-12-05 11:45:00
《中国电影经济发展研究报告》在海南岛国际电影节首发
孙向辉解读《报告》。中青报·中青网记者 任明超/摄中国青年报客户端讯(李争艳 中青报·中青网记者 任明超)12月4日,《中国电影经济发展研究报告》(以下简称《报告》)在海南岛国际电影节主论坛首发
2025-12-05 11:50:00
近日,由市稳外贸专班主办,苏州市分公司、供应链数字治理研究中心、苏州世标检测有限公司共同承办的“新外贸‘涨’字诀:精通美国知产合规赋能企业竞强价增”活动
2025-12-05 11:54:00
南京企业奋战四季度
进入四季度,南京企业在新品发布与订单签订上成果显著,重点产业创新动能强劲 产业是城市经济发展的基石。进入四季度以来
2025-12-05 12:11:00
AI时代“一人公司”迎来发展良机AI应用爆发前夜,中国第二经济大省江苏的“双子星”——南京、苏州抢先布局“单人成军”的OPC新形态OPC的全称是One Person Company
2025-12-05 12:11:00
潮品、文创、黑科技一站式打卡!河南品牌“秀”出多元消费新体验
大河网讯 蜜雪冰城诠释着国民饮品的亲切感,河南博物院文创产品让厚重历史走入百姓日常生活,力量钻石折射出河南制造闪耀的科技光芒……12月5日
2025-12-05 12:12:00
“智”绘康养,AI上美味!看豫企如何玩“智”变
大河网讯(记者 刘高雅 王靖/文 杨鑫阳/图)12月5日,“供给焕新程 服务跃新阶——2025河南省新服务新供给品牌建设交流活动”在商丘市举行
2025-12-05 12:12:00
为提升团队惠民保展业能力,夯实业务根基,太湖人保财险成功开展新员工惠民保专项培训,各团队主管全程参与研讨推进,以多维度培训为全体坐席赋能
2025-12-05 12:40:00
解锁服务新玩法!河南品牌靠数智、跨界跑出加速度
大河网讯(记者 刘高雅 王靖/文 杨鑫阳/图)12月5日,“供给焕新程 服务跃新阶——2025河南省新服务新供给品牌建设交流活动”在商丘市举行
2025-12-05 13:13:00
文创爆品、网红奶茶齐出圈,河南新品牌如何撑起新供给?
大河网讯(记者 刘高雅 王靖/文 杨鑫阳/图)12月5日,“供给焕新程 服务跃新阶——2025河南省新服务新供给品牌建设交流活动”在商丘市举行
2025-12-05 13:13:00
在当前全球化格局深度调整与数字技术革命交汇的时代背景下,研究生国际联合培养模式的数字化转型,已成为国家教育战略的核心关切
2025-12-05 13:18:00