• 我的订阅
  • 头条热搜
ChatGPT大流行的思考-解析篇
...在是给定人类的自然表述,LLM通过大量数据学习语义语法知识及既定事实,最终再用符合人类的表述方法进行反馈,讲究的是GPT去适应人,而不是人去适应GPT(这活脱脱是个绝对合格的乙方思路!谁能不爱)(2)角色定位的区...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
让大模型能快速、准确、高效地吸收新知识!被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...推理系统,TS-Reasoner 支持创建自定义模块,能够适应外部知识和用户指定的约束,具有高度的灵活性和可扩展性。这种高度的灵活性不仅增强了模型应对复杂时间序列任务的能力,还使其在需要严格约束的领域(如气候建模和投...……更多
...拆解这套训练方法,厘清模型性能提升的真正来源。 《知识分子》和Open-Reasoner-Zero团队成员胡倞成、韩琦,Light-R1团队成员邹昊晟,新加坡国立大学、Sea AI Lab研究人员刘梓辰,以及个人复现者许书尧都聊了聊,试图回答以上一...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...段:第一阶段:导师监督学习,旨在赋予模型基本的领域知识,让模型能够完成领域任务; 第二阶段:自我评估能力习得,通过借助通用大模型的指导,进一步迭代训练学习,赋予模型自我评判的能力; 第三阶段:自我提升...……更多
百川智能发布baichuan3稳定语言模型
...助力医疗资源实现普惠和平权。并且医疗问题专业性强、知识更新速度快、准确性要求高、个体差异大,能充体现大模型的各项能力,被百川智能称为“大模型皇冠上的明珠”。因此,诸如OpenAI、谷歌等头部大模型企业都将医疗...……更多
...算资源等成本只需几十美元。s1的核心创新在于采用了“知识蒸馏”技术和“预算强制”方法。“知识蒸馏”好比把别人酿好的酒进一步提纯。该模型训练数据是基于谷歌Gemini Thinking Experimental模型“蒸馏”出的仅有1000个样本的...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...段试题题目为例,模型在读取题目信息后会先列出相关的知识点,然后逐步进行推理计算,和人类解题的方式非常接近。再来看看另外一个大家都很熟悉的数字游戏24点,模型也能做到先列出相关的计算方法,然后根据最可能成...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...数学计算、代码编程,以及测试化学、物理和生物学专业知识的基准GPQA-diamond上,o1 系列模型的性能均明显优于 GPT-4o。根据OpenAI公布的信息,o1系列模型的特长并不相同,从数学能力看,o1最强,其次是o1-mini,最后是o1-preview,...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...基础模型的非凡表现。但GPT-4在需要复杂推理或特定领域知识的任务中不太熟练,文中对模型能力(理解、知识、推理和计算)的全面分析揭示了这些模型的优势和局限性。AGIEval数据集近年来,大型基础模型如GPT-4在各个领域已经...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...具备获得 IMO 金牌的数学素养,但在具体场景下利用特定知识和工具完成复杂任务(例如使用搜索引擎、处理私有文档等)的能力却是不可或缺的。这一特点也意味着 AI Agent 的开发者们需要一套既通用又高效的 Agent 构建方法论...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...对 TriMaster100 这一数据集,该团队还绘制出一幅三角函数知识图(knowledge graph)。实验中,他们发现通过搜索知识图来提供相关的知识信息,可以有效提高大模型的推理水平。 即在解答一个数学问题时,如果可以提供一些高级...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...子。检索增强生成(RAG)企业还可以通过添加特定领域的知识库来适配LLM,RAG是典型的「搜索驱动的LLM文本生成」。RAG于2020年推出,它使用动态提示上下文,通过用户问题检索并注入LLM提示,以引导其使用检索到的内容,而不...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...从根本上减少大模型幻觉,可以从让大模型学习运用已有知识来实现受限推理,向可控生成的方向进行突破。以下为对话实录:搜狐科技:来自Vectara机器学习团队的幻觉测试显示,DeepSeek-R1的幻觉率高达14.3%,显著高于V3的3.9%,...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...从海量且快速增长的视频数据中获取视觉内容来获取 3D 知识。为实现这一目标,他们首先使用一个拟议的数据整理管道来扩大训练数据的规模,该管道可自动过滤掉源视频中的多视角不一致和观察不足的内容。这样就得到了一...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...仅包含相当于分类任务的简单问题,缺乏语义推理和临床知识。如图1所示,现有的ImageCLF VQA-MED数据集仅包含「这张图像里主要异常是什么?」和「这张图片里看到了什么?」这两种完全相当于分类任务的问题。较小的数量以及...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...其专门用于评估模型在化学、物理和生物学等领域的专业知识水平,并邀请了拥有相关领域博士学位的专家参与测试。测试结果显示,o1不仅成功完成了测试,更是超越了博士表现,成为首个在GPQA diamond 基准上击败人类专家的AI...……更多
华人团队爆火instructblip抢跑看图聊天
...有阅读理解的图像字幕、视觉推理、图像问题回答、基于知识的图像问题回答,带阅读理解的图像问题回答,图像问题的生成(与QA数据集相反),视频问题回答,视觉对话问题回答,图像分类,以及LLaVA-Instruct-150K。对于每一项...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...述农业银行大模型ChatABC,对于大模型精调、提示工程、知识增强、检索增强、人类反馈的强化学习(RLHF) 等大模型相关新技术进行了深入探索和综合应用,结合农业银行研发支持知识库、内部问答数据以及人工标注数据等金融...……更多
...星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控...……更多
OpenAI直播第二弹!奥特曼2024年最大惊喜竟来自字节?强化微调让o1-mini逆袭o1
...了在特定任务上的准确性。对于那些要求高精确性和专业知识的领域,强化微调将会发挥至关重要的作用。从OpenAI的官方演示中不难看出,强化微调的效果可谓是相当显著——经过强化微调的o1 mini,竟然全面超越了当今最强的...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的研究已经表明,大模型表现出一些类人的特征,比如通过CoT一步一步推理。而且,也有一些研究称,LLM具备了元认知能力...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...据的不断积累,模型必须在学习新信息和保留先前获取的知识之间取得平衡。传统模型通常假设稳定的数据分布,但在实际场景中,新的 LTM 数据可能与早期模式显著背离,导致过拟合或灾难性遗忘等风险。有效处理这些变化对...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
...成的文本中。这可能导致出现歧视性语言或错误的陈述。知识表示:LLMs没有真正的理解语言或世界的知识,它们只是学习出现在数据中的模式。这意味着它们可能会在处理新的情况时出现问题。模型大小:LLMs需要大量的计算资...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...难的智力基准,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,OpenAI 聘请了拥有博士学位的专家来回答 GPQA Diamond 基准问题。实验结果表明:o1 超越了人类专家的表现,成为第一个在该基准测试中做...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...类才能涉足。深蓝是一个专家系统,它结合了广泛的象棋知识和启发式规则以及强大的树搜索算法(alpha-beta 剪枝)。几乎所有当代且更强大的象棋引擎都遵循类似的模式,目前世界上最强大的(公开可用的)引擎是 Stockfish 16。...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...。且思考过程采用自然语言形式,便于解释和利用预训练知识。然后系统会将这些输出中的回答部分(不含思考过程)提供给一个评判模型来打分。评判模型可以是像ArmoRM这样直接对单个回答评分的模型,也可以是像Self-Taught Eva...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...记忆格式)来降低这一成本。从概念上讲,由于其大部分知识都外化为显式记忆,因而 LLM 可以享受更少的参数大小、训练成本和推理成本。论文地址:https://arxiv.org/pdf/2407.01178论文标题:Memory3 : Language Modeling with Explici……更多
国内首个通过主任医师评测的大模型,已在夸克AI搜索上线
...整组数据驱动强化学习,夸克健康大模型不仅学会了医学知识,更掌握了医学思维的路径选择、证据整合与多解平衡能力。底层的权威医学知识库确保了模型输出内容专业、及时。安贞医院心脏外科主任医师谢进生认为,夸克在...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
...什么?一个普遍的猜测是:大模型的推理难道是在从参数知识中检索答案?该研究给出了反对这一观点的证据。作者认为,是预训练中的程序性知识在推动大模型进行推理。 自从大模型出现以来,AI 研究领域一直流传着这样一...……更多
更多关于科技的资讯:
有电储能户外电源:国庆出游不断电,畅享自然每一程
国庆长假,是探索远方、寄情山水的绝佳时机。然而,无论是长途自驾中的电子设备续航,还是露营时的照明、烹饪需求,传统的充电宝或小型发电机往往捉襟见肘
2025-09-30 13:45:00
莱西市夏格庄镇:政企同频创新培育新动能
鲁网9月30日讯(记者 葛万彩 通讯员 张磊)引进14个亿元以上高新技术项目,其中8个已开工建设;新投产的青岛新茂林机械装备制造基地
2025-09-30 10:41:00
谨防“二选一”换上新马甲
范仁超据多家媒体报道,在天猫、京东、抖音等多个平台开店的某化妆品品牌负责人日前向媒体反映,之前和某带货达人达成合作意向
2025-09-30 10:48:00
胶东在线9月28日讯(记者 卢伟霞)近日,以“山海有约 烟台有乐”为主题的2025烟台沙滩音乐季在幸福湾活力海岸圆满收官
2025-09-30 06:37:00
京津研发河北转化进行时(三):一个康复机器人的协同样本
从北京研发中心到冀州生产线一个康复机器人的协同样本9月25日,在位于衡水市冀州区的极智医疗器械(河北)有限公司生产车间
2025-09-29 08:26:00
东风与腾讯签署战略合作协议 共建“汽车+互联网”智能新生态
9月28日,东风汽车集团股份有限公司(以下简称“东风汽车”)与深圳市腾讯计算机系统有限公司(以下简称“腾讯”)在武汉举行战略合作签约仪式
2025-09-29 08:33:00
大厂:发放第二期惠民电子消费券 为消费市场注入新活力
河北新闻网讯(张嘉良)消费热潮涌动,市场活力持续攀升。日前,大厂回族自治县发放第二期“乐享大厂·焕新潮”惠民电子消费券
2025-09-29 09:49:00
唐山启动2025“迎国庆、庆中秋”系列促消费活动
河北新闻网讯(张强、王育民)9月27日,2025唐山市“迎国庆、庆中秋”系列促消费活动在路南区京东电器城市旗舰店启动。本次活动由唐山市商务局
2025-09-29 10:28:00
中新经纬9月29日电 29日,中新经纬查询中国执行信息公开网发现,该网站已经没有万达集团董事长王健林“限高”信息。28日
2025-09-29 10:58:00
京东服务商开放季交流会释放11.11商家增长信号
齐鲁晚报·齐鲁壹点 记者 王颖颖2025年9月28日,在年度电商盛宴京东11.11启幕前夕,以“开放共赢 高效合作”为主题的2025京东服务商开放季交流会在京东集团总部成功举行
2025-09-29 11:00:00
官宣!普拉斯与腾讯云深化“云+AI”合作,加速制造业智能转型
近日,四川省宜宾普拉斯包装材料有限公司(下称“普拉斯”)宣布与腾讯云深化战略合作,双方将基于普拉斯在智慧包装行业的丰富经验和腾讯在AI领域的领先技术
2025-09-29 11:05:00
王健林“限高”措施已取消,其所持4.9亿股权仍被冻结
记者9月29日查询,中国执行信息公开网已经没有万达集团董事长王健林“限高”信息。另据企查查9月29日信息,显示王健林限高措施已取消
2025-09-29 11:37:00
象屿集团与钉钉合作,打造统一、智能、全球化的AI办公平台
9月28日,厦门象屿集团有限公司(以下简称“象屿集团”)与钉钉正式达成合作协议,并宣布象屿集团新一代数字化办公平台项目建设正式启动
2025-09-29 11:37:00
春雪食品集团总裁郑钧谈品质建设与战略转型
近日,春雪食品集团股份有限公司(以下简称“春雪食品集团”)宣布,继去年扭亏为盈后,今年上半年实现归母净利润1427.65万元
2025-09-29 11:37:00
聊城智汇 链接全球丨从布艺收纳到宠物用品,泊西集团海外订单供不应求
鲁网9月29日讯在山东聊城茌平区洪官屯镇,阳光洒在错落有致的乡村院落上。走进山东泊西实业集团有限公司生产基地的产品展厅
2025-09-29 12:06:00