• 我的订阅
  • 头条热搜
ChatGPT大流行的思考-解析篇
...在是给定人类的自然表述,LLM通过大量数据学习语义语法知识及既定事实,最终再用符合人类的表述方法进行反馈,讲究的是GPT去适应人,而不是人去适应GPT(这活脱脱是个绝对合格的乙方思路!谁能不爱)(2)角色定位的区...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
让大模型能快速、准确、高效地吸收新知识!被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...推理系统,TS-Reasoner 支持创建自定义模块,能够适应外部知识和用户指定的约束,具有高度的灵活性和可扩展性。这种高度的灵活性不仅增强了模型应对复杂时间序列任务的能力,还使其在需要严格约束的领域(如气候建模和投...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...段:第一阶段:导师监督学习,旨在赋予模型基本的领域知识,让模型能够完成领域任务; 第二阶段:自我评估能力习得,通过借助通用大模型的指导,进一步迭代训练学习,赋予模型自我评判的能力; 第三阶段:自我提升...……更多
百川智能发布baichuan3稳定语言模型
...助力医疗资源实现普惠和平权。并且医疗问题专业性强、知识更新速度快、准确性要求高、个体差异大,能充体现大模型的各项能力,被百川智能称为“大模型皇冠上的明珠”。因此,诸如OpenAI、谷歌等头部大模型企业都将医疗...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...段试题题目为例,模型在读取题目信息后会先列出相关的知识点,然后逐步进行推理计算,和人类解题的方式非常接近。再来看看另外一个大家都很熟悉的数字游戏24点,模型也能做到先列出相关的计算方法,然后根据最可能成...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...数学计算、代码编程,以及测试化学、物理和生物学专业知识的基准GPQA-diamond上,o1 系列模型的性能均明显优于 GPT-4o。根据OpenAI公布的信息,o1系列模型的特长并不相同,从数学能力看,o1最强,其次是o1-mini,最后是o1-preview,...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...基础模型的非凡表现。但GPT-4在需要复杂推理或特定领域知识的任务中不太熟练,文中对模型能力(理解、知识、推理和计算)的全面分析揭示了这些模型的优势和局限性。AGIEval数据集近年来,大型基础模型如GPT-4在各个领域已经...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...具备获得 IMO 金牌的数学素养,但在具体场景下利用特定知识和工具完成复杂任务(例如使用搜索引擎、处理私有文档等)的能力却是不可或缺的。这一特点也意味着 AI Agent 的开发者们需要一套既通用又高效的 Agent 构建方法论...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...对 TriMaster100 这一数据集,该团队还绘制出一幅三角函数知识图(knowledge graph)。实验中,他们发现通过搜索知识图来提供相关的知识信息,可以有效提高大模型的推理水平。 即在解答一个数学问题时,如果可以提供一些高级...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...子。检索增强生成(RAG)企业还可以通过添加特定领域的知识库来适配LLM,RAG是典型的「搜索驱动的LLM文本生成」。RAG于2020年推出,它使用动态提示上下文,通过用户问题检索并注入LLM提示,以引导其使用检索到的内容,而不...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...从海量且快速增长的视频数据中获取视觉内容来获取 3D 知识。为实现这一目标,他们首先使用一个拟议的数据整理管道来扩大训练数据的规模,该管道可自动过滤掉源视频中的多视角不一致和观察不足的内容。这样就得到了一...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...仅包含相当于分类任务的简单问题,缺乏语义推理和临床知识。如图1所示,现有的ImageCLF VQA-MED数据集仅包含「这张图像里主要异常是什么?」和「这张图片里看到了什么?」这两种完全相当于分类任务的问题。较小的数量以及...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...其专门用于评估模型在化学、物理和生物学等领域的专业知识水平,并邀请了拥有相关领域博士学位的专家参与测试。测试结果显示,o1不仅成功完成了测试,更是超越了博士表现,成为首个在GPQA diamond 基准上击败人类专家的AI...……更多
华人团队爆火instructblip抢跑看图聊天
...有阅读理解的图像字幕、视觉推理、图像问题回答、基于知识的图像问题回答,带阅读理解的图像问题回答,图像问题的生成(与QA数据集相反),视频问题回答,视觉对话问题回答,图像分类,以及LLaVA-Instruct-150K。对于每一项...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...述农业银行大模型ChatABC,对于大模型精调、提示工程、知识增强、检索增强、人类反馈的强化学习(RLHF) 等大模型相关新技术进行了深入探索和综合应用,结合农业银行研发支持知识库、内部问答数据以及人工标注数据等金融...……更多
OpenAI直播第二弹!奥特曼2024年最大惊喜竟来自字节?强化微调让o1-mini逆袭o1
...了在特定任务上的准确性。对于那些要求高精确性和专业知识的领域,强化微调将会发挥至关重要的作用。从OpenAI的官方演示中不难看出,强化微调的效果可谓是相当显著——经过强化微调的o1 mini,竟然全面超越了当今最强的...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的研究已经表明,大模型表现出一些类人的特征,比如通过CoT一步一步推理。而且,也有一些研究称,LLM具备了元认知能力...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...据的不断积累,模型必须在学习新信息和保留先前获取的知识之间取得平衡。传统模型通常假设稳定的数据分布,但在实际场景中,新的 LTM 数据可能与早期模式显著背离,导致过拟合或灾难性遗忘等风险。有效处理这些变化对...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
...成的文本中。这可能导致出现歧视性语言或错误的陈述。知识表示:LLMs没有真正的理解语言或世界的知识,它们只是学习出现在数据中的模式。这意味着它们可能会在处理新的情况时出现问题。模型大小:LLMs需要大量的计算资...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...难的智力基准,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,OpenAI 聘请了拥有博士学位的专家来回答 GPQA Diamond 基准问题。实验结果表明:o1 超越了人类专家的表现,成为第一个在该基准测试中做...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...类才能涉足。深蓝是一个专家系统,它结合了广泛的象棋知识和启发式规则以及强大的树搜索算法(alpha-beta 剪枝)。几乎所有当代且更强大的象棋引擎都遵循类似的模式,目前世界上最强大的(公开可用的)引擎是 Stockfish 16。...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...记忆格式)来降低这一成本。从概念上讲,由于其大部分知识都外化为显式记忆,因而 LLM 可以享受更少的参数大小、训练成本和推理成本。论文地址:https://arxiv.org/pdf/2407.01178论文标题:Memory3 : Language Modeling with Explici……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...。且思考过程采用自然语言形式,便于解释和利用预训练知识。然后系统会将这些输出中的回答部分(不含思考过程)提供给一个评判模型来打分。评判模型可以是像ArmoRM这样直接对单个回答评分的模型,也可以是像Self-Taught Eva...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
...什么?一个普遍的猜测是:大模型的推理难道是在从参数知识中检索答案?该研究给出了反对这一观点的证据。作者认为,是预训练中的程序性知识在推动大模型进行推理。 自从大模型出现以来,AI 研究领域一直流传着这样一...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...了显著的性能优势。特别是在处理需要多步推理、多模态知识和快速变化答案的问题时,OmniSearch相较于现有的mRAG方法表现更为优异。目前OmniSearch在魔搭社区还有demo可玩。动态检索规划框架,打破传统mRAG局限传统mRAG方法遵循固...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...所涵盖的体系框架。本综述旨在提供具身智能的全面背景知识、研究趋势和技术见解。本综述整体架构2. 具身机器人具身智能体积极与物理环境互动,涵盖了广泛的具身形态,包括机器人、智能家电、智能眼镜和自动驾驶车辆等...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...数据科学的目的是从结构化和非结构化数据中提取见解和知识,从而解决各种复杂问题。这需要系统级的方法,需要自动化和优化来适应具体的任务目标。举个例子,在 Kaggle 数据科学竞赛中(如图 1 所示),数据科学家需要遵...……更多
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
...熟虑的对齐”(Deliberative Alignment)的新方法,以提升 AI 模型安全性,并已在 o 系列模型中取得显著成效。项目背景如何确保大语言模型(LLMs)遵守明确的道德和安全准则,目前存在诸多挑战。监督微调(SFT)和来自人类反馈的...……更多
更多关于科技的资讯:
你借的共享充电宝那么贵 它们公司却穷得快退市了
不断涨价,业绩却越做越差,共享充电宝品牌怪兽充电无奈选择了私有化退市。1 月 6 日,怪兽充电宣布收到来自信宸资本( 中信集团旗下 )和公司管理层联合发出的私有化要约
2025-01-11 15:21:00
甲流高发 医生提醒:奥司他韦不能乱吃!
近期,甲型流感(简称甲流)的发病率有所上升。奥司他韦作为一种常用的抗流感药物,在预防和治疗甲流方面发挥着重要作用。然而
2025-01-11 15:51:00
群晖备份一体机发布:开箱即用 一机即可实现多种备份
快科技1月11日消息,中小企业在业务发展过程中,随着数据量增加和备份设备增多,面临成本增长和运维效率降低的挑战。对此,群晖推出了备份一体机DP7400
2025-01-11 16:21:00
春节新风尚!百果园济南区苏绣春节礼盒发布会,传递健康年味
临近春节,年味渐浓,百果园济南区2025 年春节系列礼盒发布会圆满落幕。发布会上,百果园×非遗苏绣传承人卢建英春节联名系列礼盒惊艳亮相
2025-01-11 16:30:00
华为解决5G最大弊端:不怕演唱会没信号了
快科技1月11日消息,随着5G深入建设,大型体育场馆和演唱会等高容量场景面临覆盖范围和上下行容量的挑战。近日,浙江电信携手华为在宁波完成了FDD Massive MIMO的创新商用测试
2025-01-11 16:51:00
索尼本田联手造了台66万的车 卖这么贵你就给我这个
快到年边了,没想到这位日本新势力抢在年前,给我们拉了坨大的。这次 CES ( 国际消费类电子产品展览会 )上,索尼本田又带着它的 AFEELA 来秀存在了
2025-01-11 16:51:00
搞这么厉害怎么不早点告诉我,ces上极氪展台都挤爆了
有幸围观了一下,不看不知道,极氪展台这是要晋升车界的甜甜圈吗,每个人都想来尝一尝看一看,这么多人,还有外国友人来凑热闹
2025-01-11 17:17:00
奢侈品牌大变动!据称普拉达正在考虑收购范思哲
据媒体周五(1月10日)报道,全球时尚奢侈品集团Capri Holdings计划出售旗下的范思哲(Versace),普拉达(Prada)正在考虑收购
2025-01-11 17:21:00
开门红!2025年电影总票房破10亿
快科技1月11日消息,根据灯塔专业版的数据,截至1月11日14时47分,今年的总票房(含预售)已经突破10亿元大关。其中
2025-01-11 17:21:00
本文转自:人民网-科普中国量子计算机,这一曾被视为科幻的技术奇迹,如今正逐步从理论走向现实,并在不断迭代中展现其颠覆性的计算潜力。
2025-01-11 17:25:00
全球首款骁龙8至尊版折叠屏!OPPO Find N5下周官宣:产品足够惊艳
快科技1月11日消息,今天,OPPO周意保预告,OPPO Find N5会在下周公布发布时间。周意保与网友互动时表示,OPPO Find N5足够惊艳
2025-01-11 17:51:00
辽宁移动旗舰店·沈阳十一纬路店:焕新绽放,重启极致用户体验
本文转自:人民网-辽宁频道近日,辽宁移动旗舰店·沈阳十一纬路店(以下简称“十一纬路旗舰店”)完成了全面的升级改造,以新型智慧营业厅的形象惊艳亮相
2025-01-11 18:18:00
当然有的,主要是以下三个渠道,大家可以根据自己的需要来选择。一、查询中标公告的官方渠道:①政府采购网站:中国政府采购网及其省级和市级分支是最权威的信息来源
2025-01-11 18:18:00
点击查看视频星品入驻,全球共享。旅游零售市场是国产品牌向世界展现东方风土、中国味道的绝佳窗口。本期《每周探店》来到了cdf海口国际免税城——这里正在举行长城五星G家族入驻中免集团的首发仪式
2025-01-11 18:41:00
蚂蚁集团完成收购好大夫:帮8亿用户找到28万好医生
快科技1月11日消息,在今天举办的2025年度好大夫峰会现场,蚂蚁集团和好大夫在线完成收购后首度同台亮相。双方共同宣布
2025-01-11 18:51:00