• 我的订阅
  • 头条热搜
ChatGPT大流行的思考-解析篇
...在是给定人类的自然表述,LLM通过大量数据学习语义语法知识及既定事实,最终再用符合人类的表述方法进行反馈,讲究的是GPT去适应人,而不是人去适应GPT(这活脱脱是个绝对合格的乙方思路!谁能不爱)(2)角色定位的区...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
让大模型能快速、准确、高效地吸收新知识!被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...推理系统,TS-Reasoner 支持创建自定义模块,能够适应外部知识和用户指定的约束,具有高度的灵活性和可扩展性。这种高度的灵活性不仅增强了模型应对复杂时间序列任务的能力,还使其在需要严格约束的领域(如气候建模和投...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...段:第一阶段:导师监督学习,旨在赋予模型基本的领域知识,让模型能够完成领域任务; 第二阶段:自我评估能力习得,通过借助通用大模型的指导,进一步迭代训练学习,赋予模型自我评判的能力; 第三阶段:自我提升...……更多
百川智能发布baichuan3稳定语言模型
...助力医疗资源实现普惠和平权。并且医疗问题专业性强、知识更新速度快、准确性要求高、个体差异大,能充体现大模型的各项能力,被百川智能称为“大模型皇冠上的明珠”。因此,诸如OpenAI、谷歌等头部大模型企业都将医疗...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...段试题题目为例,模型在读取题目信息后会先列出相关的知识点,然后逐步进行推理计算,和人类解题的方式非常接近。再来看看另外一个大家都很熟悉的数字游戏24点,模型也能做到先列出相关的计算方法,然后根据最可能成...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...数学计算、代码编程,以及测试化学、物理和生物学专业知识的基准GPQA-diamond上,o1 系列模型的性能均明显优于 GPT-4o。根据OpenAI公布的信息,o1系列模型的特长并不相同,从数学能力看,o1最强,其次是o1-mini,最后是o1-preview,...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...基础模型的非凡表现。但GPT-4在需要复杂推理或特定领域知识的任务中不太熟练,文中对模型能力(理解、知识、推理和计算)的全面分析揭示了这些模型的优势和局限性。AGIEval数据集近年来,大型基础模型如GPT-4在各个领域已经...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...具备获得 IMO 金牌的数学素养,但在具体场景下利用特定知识和工具完成复杂任务(例如使用搜索引擎、处理私有文档等)的能力却是不可或缺的。这一特点也意味着 AI Agent 的开发者们需要一套既通用又高效的 Agent 构建方法论...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...对 TriMaster100 这一数据集,该团队还绘制出一幅三角函数知识图(knowledge graph)。实验中,他们发现通过搜索知识图来提供相关的知识信息,可以有效提高大模型的推理水平。 即在解答一个数学问题时,如果可以提供一些高级...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...子。检索增强生成(RAG)企业还可以通过添加特定领域的知识库来适配LLM,RAG是典型的「搜索驱动的LLM文本生成」。RAG于2020年推出,它使用动态提示上下文,通过用户问题检索并注入LLM提示,以引导其使用检索到的内容,而不...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...从海量且快速增长的视频数据中获取视觉内容来获取 3D 知识。为实现这一目标,他们首先使用一个拟议的数据整理管道来扩大训练数据的规模,该管道可自动过滤掉源视频中的多视角不一致和观察不足的内容。这样就得到了一...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...仅包含相当于分类任务的简单问题,缺乏语义推理和临床知识。如图1所示,现有的ImageCLF VQA-MED数据集仅包含「这张图像里主要异常是什么?」和「这张图片里看到了什么?」这两种完全相当于分类任务的问题。较小的数量以及...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...其专门用于评估模型在化学、物理和生物学等领域的专业知识水平,并邀请了拥有相关领域博士学位的专家参与测试。测试结果显示,o1不仅成功完成了测试,更是超越了博士表现,成为首个在GPQA diamond 基准上击败人类专家的AI...……更多
华人团队爆火instructblip抢跑看图聊天
...有阅读理解的图像字幕、视觉推理、图像问题回答、基于知识的图像问题回答,带阅读理解的图像问题回答,图像问题的生成(与QA数据集相反),视频问题回答,视觉对话问题回答,图像分类,以及LLaVA-Instruct-150K。对于每一项...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...述农业银行大模型ChatABC,对于大模型精调、提示工程、知识增强、检索增强、人类反馈的强化学习(RLHF) 等大模型相关新技术进行了深入探索和综合应用,结合农业银行研发支持知识库、内部问答数据以及人工标注数据等金融...……更多
OpenAI直播第二弹!奥特曼2024年最大惊喜竟来自字节?强化微调让o1-mini逆袭o1
...了在特定任务上的准确性。对于那些要求高精确性和专业知识的领域,强化微调将会发挥至关重要的作用。从OpenAI的官方演示中不难看出,强化微调的效果可谓是相当显著——经过强化微调的o1 mini,竟然全面超越了当今最强的...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的研究已经表明,大模型表现出一些类人的特征,比如通过CoT一步一步推理。而且,也有一些研究称,LLM具备了元认知能力...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...据的不断积累,模型必须在学习新信息和保留先前获取的知识之间取得平衡。传统模型通常假设稳定的数据分布,但在实际场景中,新的 LTM 数据可能与早期模式显著背离,导致过拟合或灾难性遗忘等风险。有效处理这些变化对...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
...成的文本中。这可能导致出现歧视性语言或错误的陈述。知识表示:LLMs没有真正的理解语言或世界的知识,它们只是学习出现在数据中的模式。这意味着它们可能会在处理新的情况时出现问题。模型大小:LLMs需要大量的计算资...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...难的智力基准,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,OpenAI 聘请了拥有博士学位的专家来回答 GPQA Diamond 基准问题。实验结果表明:o1 超越了人类专家的表现,成为第一个在该基准测试中做...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...类才能涉足。深蓝是一个专家系统,它结合了广泛的象棋知识和启发式规则以及强大的树搜索算法(alpha-beta 剪枝)。几乎所有当代且更强大的象棋引擎都遵循类似的模式,目前世界上最强大的(公开可用的)引擎是 Stockfish 16。...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...记忆格式)来降低这一成本。从概念上讲,由于其大部分知识都外化为显式记忆,因而 LLM 可以享受更少的参数大小、训练成本和推理成本。论文地址:https://arxiv.org/pdf/2407.01178论文标题:Memory3 : Language Modeling with Explici……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...。且思考过程采用自然语言形式,便于解释和利用预训练知识。然后系统会将这些输出中的回答部分(不含思考过程)提供给一个评判模型来打分。评判模型可以是像ArmoRM这样直接对单个回答评分的模型,也可以是像Self-Taught Eva...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
...什么?一个普遍的猜测是:大模型的推理难道是在从参数知识中检索答案?该研究给出了反对这一观点的证据。作者认为,是预训练中的程序性知识在推动大模型进行推理。 自从大模型出现以来,AI 研究领域一直流传着这样一...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...了显著的性能优势。特别是在处理需要多步推理、多模态知识和快速变化答案的问题时,OmniSearch相较于现有的mRAG方法表现更为优异。目前OmniSearch在魔搭社区还有demo可玩。动态检索规划框架,打破传统mRAG局限传统mRAG方法遵循固...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...所涵盖的体系框架。本综述旨在提供具身智能的全面背景知识、研究趋势和技术见解。本综述整体架构2. 具身机器人具身智能体积极与物理环境互动,涵盖了广泛的具身形态,包括机器人、智能家电、智能眼镜和自动驾驶车辆等...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...数据科学的目的是从结构化和非结构化数据中提取见解和知识,从而解决各种复杂问题。这需要系统级的方法,需要自动化和优化来适应具体的任务目标。举个例子,在 Kaggle 数据科学竞赛中(如图 1 所示),数据科学家需要遵...……更多
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
...熟虑的对齐”(Deliberative Alignment)的新方法,以提升 AI 模型安全性,并已在 o 系列模型中取得显著成效。项目背景如何确保大语言模型(LLMs)遵守明确的道德和安全准则,目前存在诸多挑战。监督微调(SFT)和来自人类反馈的...……更多
更多关于科技的资讯:
科氪 | 开局即决战 ROG助力电影《流浪地球3》美术创作
2025年2 月 25 日,ROG正式官宣与电影《流浪地球》系列再度携手,高能助力小破球的新一轮冒险。ROG作为电影《流浪地球3》官方拍摄期创作算力先锋
2025-02-25 22:17:00
注意!手机贴防窥膜易加剧近视:长时间使用引起视疲劳症
快科技2月25日消息,据报道,防窥膜作为保护隐私的“神器”,因其独特的“百叶窗”光学设计,可限制屏幕侧面可视角度,但用户普遍反映使用后易出现视疲劳
2025-02-25 16:34:00
周鸿祎AI短剧上线:黄奕伪装刺杀其画面曝光 两人有不少动作戏
快科技2月25日消息,今日,由360集团董事长周鸿祎出演的首部AI短剧,在万众期待下终于上线了。因为知名影视演员黄奕的加入
2025-02-25 16:34:00
曾喊话中国传统教育必须要改革!俞敏洪:不应把上名牌大学作为孩子的人生目标
快科技2月25日消息,新东方创始人、新东方教育科技集团董事长俞敏洪现身郑州谈家庭教育。俞敏洪称“不应把上名牌大学作为孩子的人生目标”
2025-02-25 16:34:00
双拼色方案 小米YU7内饰实拍曝光:更偏向家用了
快科技2月25日消息,小米YU7内饰谍照再次得到曝光,此次展示了该车的更多细节。整体来看,YU7将采取双拼色方案,中控扶手区域得到重新优化
2025-02-25 16:34:00
比迈巴赫整车还贵!布加迪推出史上最壕改装套件:售价174万元
快科技2月25日消息,布加迪近日为其新款Tourbillon超跑推出名为“Equipe Pur Sang”的专属选装套件
2025-02-25 16:34:00
大众网记者 刘迪 通讯员 姚登位 济宁报道近年来,兴业银行济南分行积极响应国家创新驱动发展战略,充分发挥金融力量,深度聚焦技术流企业
2025-02-25 17:03:00
能抗-40℃极寒:西安交大成功研发钠离子低温软包电池
快科技2月5日消息,据“西安发布”官方报道,近日,西安交通大学化学工程与技术学院唐伟教授团队在钠离子电池领域取得了重要进展
2025-02-25 17:04:00
骑手谈京东承担骑手五险一金全部成本:找到父母眼中的好工作了
快科技2月25日消息,日前,京东宣布,鉴于目前外卖骑手的平均薪酬远低于京东快递小哥,为薪酬公平性,未来一段时期签约的外卖全职骑手缴纳五险一金的所有成本
2025-02-25 17:04:00
同档最强性能神机!真我Neo7 SE正式发布:1530元起
快科技2月25日消息,今天下午,真我Neo7 SE正式发布。售价方面,8GB+256GB售价1799元,12GB+256GB售价1899元
2025-02-25 17:04:00
我国自研!全球最大功率甲醇双燃料船用发动机发布:工业酒精变航海燃料
快科技2月25日消息,据媒体报道,中船集团今日宣布,其自主研制的全球最大功率甲醇双燃料船用发动机WinGD X92DF-M-1
2025-02-25 17:04:00
拯救苹果的经典之作!iMac设计仅用了三周时间
快科技2月25日消息,苹果前首席设计师乔纳森·艾维(Jony Ive)近期在接受访谈时,回顾了他与史蒂夫·乔布斯的合作历程
2025-02-25 17:04:00
快科技2月25日消息,据媒体报道,近日,巴西发生一起两车相撞的交通事故,一名女子在事故中被夹在两车中间却奇迹般未受伤。该事件引发广泛关注
2025-02-25 17:04:00
浏览更便利!知乎取消不登录无法看全文限制
快科技2月25日消息,据报道,近日,知乎PC网页端取消了非登录用户查看全文的限制,用户无需登录即可直接浏览完整内容。据悉
2025-02-25 17:04:00
特斯拉高管:Model S和Model X不会停产 年底还有升级
快科技2月25日消息,特斯拉车辆工程副总裁拉尔斯·莫拉维(Lars Moravy)在节目中透露,特斯拉计划在今年年底对Model S和Model X两款车型进行更新
2025-02-25 17:04:00