• 我的订阅
  • 头条热搜
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
新智元报道编辑:乔杨【新智元导读】今天,OpenAI悄悄在博客上发布了一篇新论文——CriticGPT,而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。O...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
新智元报道编辑:乔杨 好困【新智元导读】能抗衡AlphaFold 3的生命科学大模型终于出现了。初创公司Evolutionary Scale AI发布了他们最新的98B参数蛋白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...好数据集 Align-Anything,提供详细的人类偏好注释以及用于批评和改进的精细语言反馈,在增强模型的多模态理解能力的同时,从而实现跨模态的全面评估和改进。全模态大模型与全模态对齐大模型性能的最后一块拼图 人类在日...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...为在单一模型内构建有向无环图(DAG)。DAG由代表命题、批评、精炼和验证的节点组成,边表示它们之间的逻辑关系或依赖关系,边都有方向,不存在任何循环路径。这种无环的特性确保推理过程不受循环依赖的影响,能更真实...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许多人提到,相对...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...有益的。值得一提的是,这篇论文来自 OpenAI 的超级对齐团队,其中几位作者在今年早些时候已经离开 OpenAI,团队也已经分崩离析。其中一位作者透露,这是该团队的最后一篇论文。 一个直观的例子为了提高模型输出的可读性...……更多
硅谷手记|AI抄袭背后的硅谷“不光彩文化”
...证据和对方反应来看,抄袭性质已比较确定”。曼宁发声批评后,斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉,并表示要完全撤下Llama3-V模型。在当前的人工智能热潮中,这个事件引发广泛关注。有观点认为...……更多
...—如何将成千上万张GPU卡串联在一起,让它们充分发挥算力作用。这是“BAT”目前也没有完全解决的问题。数学解题能力靠“打补丁”除了功能增加,GPT-4的文本处理和生成能力也优于ChatGPT。谈及这个大模型的数学水平,赵海笑道:...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...锁了提升SOTA的最大增幅——57%!至于Genie的实际效果,用团队的话来说就是:它可以做到像人类工程师一样解决现实生活中的软件问题。首先,你可以用4种方式让Genie开始工作,分别是提示词、GitHub Issue、Linear Ticket或者API。以...……更多
...具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具,如西湖大学文本智能实验室研发的Fast-DetectGPT。人类的创作与AIGC之间存在哪些差异?AI检测工具如何根据...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
Google DeepMind团队发表了一篇研究论文,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...要阶段,接在预训练和监督微调(SFT)之后。我对RLHF的批评是:它几乎算不上是真正的强化学习,而且我认为这一点没有被广泛理解。强化学习很强大,而RLHF则不然。 让我们来看一个AlphaGo的例子,它的训练用到了实际的RL算...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...程完成这一任务吗?为此,来自图灵奖得主 Yoshua Bengio 的团队提出了全新的视觉问答任务:视觉字幕恢复(Visual Caption Restoration,VCR)。让我们借由这个任务对视觉语言模型的推理能力一探究竟:当前的视觉语言模型距离人类的...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...了这一观点。来自达姆施塔特工业大学和巴斯大学的研究团队发现,GPT 等 LLM 尚无法独立地学习或获得新技能,这意味着它们不会对人类构成生存威胁。他们表示,“涌现能力” 背后的真相或许比科幻电影更富有戏剧性,许多...……更多
国内首个类ChatGPT模型发布,服务器被挤崩
...悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台,邀观众参与内测。看过《流浪地球2》的伙伴应该对MOSS这个名字很熟悉,据悉团队在训练完成第一代模型的时候,正值该片热映,片中的人工智能550W...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...器偏差分析对LLM自动评估器(LLM-as-a-Judge autorater)的常见批评主要涉及他们对某些判断的偏见。通过在自动评估器偏见基准CoBBLEr上评估 FLAMe及其变体,论文发现FLAMe模型比其他流行的LLM自动评估器的偏见要小得多。 CoBBLEr主要测...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...当「第一个吃螃蟹的人」,不发模型是担心可能的带来的批评和负面舆论。一旦有了能将VALL-E转化为产品的方法,或者市场上杀出其他竞品,难道还担心微软有钱不赚吗? 的确如网友所说,从项目页面目前放出的demo来看,很难...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...模型attention计算的额外开销。为了确定最优激活参数量,团队投入大量成本展开实验:训练一系列激活参数范围从10M到1B的模型,使用最高1000亿tokens的训练数据,覆盖100亿到1000亿tokens的不同数据规模。使用isoFLOPs曲线,在固定计...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
Meta版慢思考也来了。田渊栋团队带来新作Dualformer,把快慢思考无缝结合,性能提升还成本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可...……更多
AI “早筛” 癌症,准确区分13种癌症,准确率98.2%,人类尽早治疗癌症还远吗?
...行治疗。日前,来自伦敦帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET,通过观察 DNA 甲基化模式,从非癌组织中识别出 13 种不同类型的癌症(包括乳腺癌、肝癌、肺癌和前列腺癌等),准确率高达 9...……更多
人工智能为了游戏获胜会“说谎”
...人工智能会欺骗人类?5月13日,美国麻省理工学院的研究团队称,部分人工智能系统已经学会如何欺骗人类,包括部分号称已被训练成乐于助人和诚实的系统。国内AI企业相关负责人指出,AI缺乏对谎言伦理后果的认知,其行为...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...OpenAI的竞争对手。作为OpenAI创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此...……更多
...莹利用卷积神经网络技术和实际比赛视频,德国一个研究团队训练出能够识别运动员情绪的AI(人工智能)模型。它根据网球运动员在比赛中的肢体语言识别其情感状态,准确率可达到人类观察者水平。德国卡尔斯鲁厄理工学院...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...现实世界中的各种物体进行交互的,由此来自微软的研究团队提出了IGOR。究竟怎样才能学到人类和机器人统一的动作表示呢?IGOR框架解读IGOR框架如下所示,包含三个基础模型:Latent Action Model、Policy Model和World Model。具体来说,...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...的效果。同时,这类营销方法甚至遭到了谷歌内部员工的批评。截至发稿前,钛媒体App在谷歌官方社交账号上已经承认该视频经过编辑。“出于本演示的目的,为了简洁起见,延迟已减少,Gemini输出也已缩短。”谷歌表示。据悉...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
近日,清华大学硕士生徐冬阳和所在团队,为了助力自动驾驶技术的进一步发展,他们提出一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...们没有验证模型是否正确,就匆忙进行了发布面对公众的批评,我们没有妥善处理好这些问题我们能够复现最初声称的模型基准测试分数,并正在分享评估代码我们能够复现模型声称自己是Claude的行为,我们从未通过API提供任何...……更多
天工开物 智破难关
...小时的速度跑起来?记者就此采访了“天工”背后的研发团队。灵巧关节扛住运动爆发力“天工”诞生地——北京人形机器人创新中心,研发办公室的布设很简单。一群“80后”“90后”工程师围坐在一张长长的会议桌旁,身边...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...任务的扩散基础模型,由清华大学人工智能研究院 TSAIL 团队构建。当前,机器人领域公认的卡脖子问题是 “不够智能”。许多模型需要人教几十遍才能完成单个任务,面对没教过的情况则 “束手无策”。而 RDT 正是这个 “智能...……更多
更多关于科技的资讯:
朱丽媛 中国矿业大学徐海学院功能高分子材料是近年来材料科学领域的研究热点,因其独特的物理、化学性能和广泛的应用前景,受到了广泛关注
2024-11-15 23:55:00
杨孝聪 中国矿业大学徐海学院近年来,电气自动化技术快速发展,其在照明工程中的应用也日益广泛。电气自动化技术能够实现对照明系统的智能感知
2024-11-15 23:55:00
顾蒙 中国人民大学摘要:数字经济通过提高信息流通效率、降低交易成本和优化资源配置,显著促进了经济增长。此外,数字化转型通过创新活动的加速
2024-11-15 23:55:00
孔媛媛 对外经济贸易大学国际商学院摘要:数字经济环境下,企业管理模式正经历深刻变革,创新成为提升竞争力的关键因素。本文从数字化趋势出发
2024-11-15 23:55:00
黄元伟 贵州黔南科技学院组合训练在高校足球运动训练中的应用已经成为一种越来越受重视的训练方法。随着足球运动的发展和竞争日益激烈
2024-11-15 23:55:00
国科天成(301571)深耕光电领域十余年,主要从事红外热成像等光电领域的研发、生产、销售与服务业务。公司主要提供制冷型红外机芯
2024-11-16 00:05:00
号称最美小直屏!OPPO Reno13系列看点汇总
上个月,OPPO带来了自家的新一代旗舰OPPO Find X8系列,其卓越的抓拍能力和相机功能着实赢得了很多用户的好评
2024-11-16 00:21:00
强强联合,伯恩光学联手伟世通瞄准印度苹果供应链商机
据印度当地权威媒体《经济时报》近日报道,伯恩光学将与伟世通集团强强联手,合资成立新公司,一起进入印度不断增长的苹果供应链网络
2024-11-16 01:11:00
本文转自:人民日报海外版《 人民日报海外版 》( 2024年11月16日 第 04 版)新华社香港11月14日电 (记者王昕怡)由邵逸夫奖基金会及香港科学馆主办的邵逸夫奖得主圆桌论坛14日在香港举行
2024-11-16 05:27:00
小米汽车四大预研技术汇总:为自动驾驶打造
量产一代,发布一代,预研一代。11月14日,雷军公布小米汽车最新四大预研技术成果,为SU7背后的研发投入划上圆满句号,也彻底完成了自宣布造车以来的技术储备闭环生态
2024-11-15 22:51:00
小米智能底盘可原地掉头:对比燃油车有什么区别 一文读懂
快科技11月15日消息,今天,小米官方带来了新一期问答,有网友问:“燃油车也可以原地掉头,小米智能底盘有什么区别?”小米汽车官微表示
2024-11-15 22:51:00
蔚来宣布在阿塞拜疆市场开展业务:进一步拓展全球化版图
快科技11月15日消息,在阿塞拜疆首都巴库举办的《联合国气候变化框架公约》第二十九次缔约方大会(第29届联合国气候变化大会
2024-11-15 23:21:00
罗永浩:建议大家购买新能源汽车时优先考虑二手 更具性价比
快科技11月15日消息,瓜子二手车亮相2024广州车展,这次瓜子二手车邀请罗永浩担任首席砸价官,罗永浩现场抡大锤砸穿新能源底价
2024-11-15 20:21:00
2699元起 ROG THOR雷神III 1200/1000W电源上架:引入GaN氮化镓
快科技11月15日消息,ROG THOR雷神III 1200/1000W电源目前已经上市,首发2699元。据悉,新款电源支持最新的ATX 3
2024-11-15 20:21:00
RTX 50全系升级12V-2x6供电接口!最高功率450W
快科技11月15日消息,RTX 40全系标配了新一代12VHPWR 16针供电接口,但因为缺陷而在RTX 4090上出现了多次烧毁事件
2024-11-15 20:51:00