• 我的订阅
  • 头条热搜
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
新智元报道编辑:乔杨【新智元导读】今天,OpenAI悄悄在博客上发布了一篇新论文——CriticGPT,而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。O...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
新智元报道编辑:乔杨 好困【新智元导读】能抗衡AlphaFold 3的生命科学大模型终于出现了。初创公司Evolutionary Scale AI发布了他们最新的98B参数蛋白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...好数据集 Align-Anything,提供详细的人类偏好注释以及用于批评和改进的精细语言反馈,在增强模型的多模态理解能力的同时,从而实现跨模态的全面评估和改进。全模态大模型与全模态对齐大模型性能的最后一块拼图 人类在日...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...为在单一模型内构建有向无环图(DAG)。DAG由代表命题、批评、精炼和验证的节点组成,边表示它们之间的逻辑关系或依赖关系,边都有方向,不存在任何循环路径。这种无环的特性确保推理过程不受循环依赖的影响,能更真实...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许多人提到,相对...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...有益的。值得一提的是,这篇论文来自 OpenAI 的超级对齐团队,其中几位作者在今年早些时候已经离开 OpenAI,团队也已经分崩离析。其中一位作者透露,这是该团队的最后一篇论文。 一个直观的例子为了提高模型输出的可读性...……更多
硅谷手记|AI抄袭背后的硅谷“不光彩文化”
...证据和对方反应来看,抄袭性质已比较确定”。曼宁发声批评后,斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉,并表示要完全撤下Llama3-V模型。在当前的人工智能热潮中,这个事件引发广泛关注。有观点认为...……更多
...—如何将成千上万张GPU卡串联在一起,让它们充分发挥算力作用。这是“BAT”目前也没有完全解决的问题。数学解题能力靠“打补丁”除了功能增加,GPT-4的文本处理和生成能力也优于ChatGPT。谈及这个大模型的数学水平,赵海笑道:...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...锁了提升SOTA的最大增幅——57%!至于Genie的实际效果,用团队的话来说就是:它可以做到像人类工程师一样解决现实生活中的软件问题。首先,你可以用4种方式让Genie开始工作,分别是提示词、GitHub Issue、Linear Ticket或者API。以...……更多
...具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具,如西湖大学文本智能实验室研发的Fast-DetectGPT。人类的创作与AIGC之间存在哪些差异?AI检测工具如何根据...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
Google DeepMind团队发表了一篇研究论文,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...要阶段,接在预训练和监督微调(SFT)之后。我对RLHF的批评是:它几乎算不上是真正的强化学习,而且我认为这一点没有被广泛理解。强化学习很强大,而RLHF则不然。 让我们来看一个AlphaGo的例子,它的训练用到了实际的RL算...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...程完成这一任务吗?为此,来自图灵奖得主 Yoshua Bengio 的团队提出了全新的视觉问答任务:视觉字幕恢复(Visual Caption Restoration,VCR)。让我们借由这个任务对视觉语言模型的推理能力一探究竟:当前的视觉语言模型距离人类的...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...了这一观点。来自达姆施塔特工业大学和巴斯大学的研究团队发现,GPT 等 LLM 尚无法独立地学习或获得新技能,这意味着它们不会对人类构成生存威胁。他们表示,“涌现能力” 背后的真相或许比科幻电影更富有戏剧性,许多...……更多
国内首个类ChatGPT模型发布,服务器被挤崩
...悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台,邀观众参与内测。看过《流浪地球2》的伙伴应该对MOSS这个名字很熟悉,据悉团队在训练完成第一代模型的时候,正值该片热映,片中的人工智能550W...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...器偏差分析对LLM自动评估器(LLM-as-a-Judge autorater)的常见批评主要涉及他们对某些判断的偏见。通过在自动评估器偏见基准CoBBLEr上评估 FLAMe及其变体,论文发现FLAMe模型比其他流行的LLM自动评估器的偏见要小得多。 CoBBLEr主要测...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...当「第一个吃螃蟹的人」,不发模型是担心可能的带来的批评和负面舆论。一旦有了能将VALL-E转化为产品的方法,或者市场上杀出其他竞品,难道还担心微软有钱不赚吗? 的确如网友所说,从项目页面目前放出的demo来看,很难...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...模型attention计算的额外开销。为了确定最优激活参数量,团队投入大量成本展开实验:训练一系列激活参数范围从10M到1B的模型,使用最高1000亿tokens的训练数据,覆盖100亿到1000亿tokens的不同数据规模。使用isoFLOPs曲线,在固定计...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
Meta版慢思考也来了。田渊栋团队带来新作Dualformer,把快慢思考无缝结合,性能提升还成本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可...……更多
AI “早筛” 癌症,准确区分13种癌症,准确率98.2%,人类尽早治疗癌症还远吗?
...行治疗。日前,来自伦敦帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET,通过观察 DNA 甲基化模式,从非癌组织中识别出 13 种不同类型的癌症(包括乳腺癌、肝癌、肺癌和前列腺癌等),准确率高达 9...……更多
人工智能为了游戏获胜会“说谎”
...人工智能会欺骗人类?5月13日,美国麻省理工学院的研究团队称,部分人工智能系统已经学会如何欺骗人类,包括部分号称已被训练成乐于助人和诚实的系统。国内AI企业相关负责人指出,AI缺乏对谎言伦理后果的认知,其行为...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...OpenAI的竞争对手。作为OpenAI创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此...……更多
...莹利用卷积神经网络技术和实际比赛视频,德国一个研究团队训练出能够识别运动员情绪的AI(人工智能)模型。它根据网球运动员在比赛中的肢体语言识别其情感状态,准确率可达到人类观察者水平。德国卡尔斯鲁厄理工学院...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...起来了~接下来,具体康康获奖论文有哪些~上交大CMU等团队获最佳论文此次共有5项研究成果获得EMNLP’24最佳论文奖。1、An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance(图像能表达千言万语……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...现实世界中的各种物体进行交互的,由此来自微软的研究团队提出了IGOR。究竟怎样才能学到人类和机器人统一的动作表示呢?IGOR框架解读IGOR框架如下所示,包含三个基础模型:Latent Action Model、Policy Model和World Model。具体来说,...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...的效果。同时,这类营销方法甚至遭到了谷歌内部员工的批评。截至发稿前,钛媒体App在谷歌官方社交账号上已经承认该视频经过编辑。“出于本演示的目的,为了简洁起见,延迟已减少,Gemini输出也已缩短。”谷歌表示。据悉...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
近日,清华大学硕士生徐冬阳和所在团队,为了助力自动驾驶技术的进一步发展,他们提出一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...们没有验证模型是否正确,就匆忙进行了发布面对公众的批评,我们没有妥善处理好这些问题我们能够复现最初声称的模型基准测试分数,并正在分享评估代码我们能够复现模型声称自己是Claude的行为,我们从未通过API提供任何...……更多
天工开物 智破难关
...小时的速度跑起来?记者就此采访了“天工”背后的研发团队。灵巧关节扛住运动爆发力“天工”诞生地——北京人形机器人创新中心,研发办公室的布设很简单。一群“80后”“90后”工程师围坐在一张长长的会议桌旁,身边...……更多
更多关于科技的资讯:
“5G+工业互联网”孕育新发展
本文转自:人民日报海外版叶 子 宋佳航《人民日报海外版》(2024年11月29日第 08 版)在安徽省滁州市南谯区500千伏变电站
2024-11-29 04:23:00
vivo S20系列手机亮相
本文转自:人民日报《 人民日报 》( 2024年11月29日 第 12 版)在全球化日益深入的今天,中国品牌更需在传承弘扬中华优秀传统文化中凝聚发展动力
2024-11-29 06:18:00
国网安徽电力  深化量子技术应用  推进新型电力系统建设
本文转自:人民日报《 人民日报 》( 2024年11月29日 第 11 版)11月29日,2024量子科技和产业大会在安徽省合肥市召开
2024-11-29 06:18:00
南方电网互联网服务有限公司:激活数据要素潜能  赋能新质生产力发展  打造全链路数字化的能源产业互联网平台
本文转自:人民日报《 人民日报 》( 2024年11月29日 第 16 版)南方电网互联网服务有限公司(简称“南网互联网公司”)积极响应国家号召
2024-11-29 06:24:00
在“一瞬间”感受科技突破(看台人语)
本文转自:人民日报《 人民日报 》( 2024年11月29日 第 20 版)纪录片《科学的七个瞬间》海报提到科学家,人们往往联想起漫长的科研过程
2024-11-29 06:25:00
胖东来回应1件羽绒服利润仅3毛:促销让利商品
11月29日消息,据媒体报道,网友发现胖东来每件羽绒服都标有进货价,甚至一件鹅绒羽绒服进货价对比售价显示利润仅3毛。胖东来回应称
2024-11-29 07:03:00
电动汽车的“移动充电宝”、手术后的无创“缝合卫士”、全自动猪场废水处理系统……你能想象吗,这些充满创意的“黑科技”,都来自在校大学生
2024-11-29 07:15:00
昨日,在杭州平台经济发展20年巡礼活动上,一组数据见证了杭州20年间平台经济从“无”到“有”、从“0”到“N”的全过程
2024-11-29 07:15:00
20个跨境电商平台到场,100家跨境电商优质服务商和500家全国产业带源头工厂参展,60位跨境大咖现场分享,数万名跨境电商从业者观展
2024-11-29 07:15:00
打破垄断!我国推动电信、互联网等领域有序扩大开放
快科技11月29日消息,据国内媒体报道称,我国将大力发展数字技术贸易。加强关键核心技术创新,加快发展通信、物联网、云计算
2024-11-29 07:33:00
小米总裁卢伟冰:「人车家全生态」加速全球化,五年内将在海外开1万家小米之家
11月28日,小米集团合伙人、总裁卢伟冰在36氪主办的“WSIE商业之王”大会上做了题为《「人车家全生态」如何走向全球》的分享
2024-11-28 23:58:00
近年来,大丰农商银行围绕省联社金融科技发展规划,紧扣数字化转型步伐,践行社会责任,发挥金融科技支撑,探索利用“大中台+小前台”的架构模式来提升数据服务效率和客户体验
2024-11-28 22:54:00
《王者荣耀》S38赛季重磅更新:一次可加三颗星 被演不掉星
快科技11月28日消息,《王者荣耀》S38新赛季体验优化现已上线体验服。官方带来了一图速览,有三大重磅优化:1、守护对局——新增局内实时监测和处罚
2024-11-28 23:03:00
超期服役20年 日本核燃料公司数百台设备从未全面拆解检修
当地时间11月28日,日本核燃料公司的社长增田尚宏在记者会上透露了一个惊人的消息。该公司位于青森县六所村的铀浓缩工厂自建成30多年来
2024-11-28 23:33:00
科技引领未来,圆桌对话探讨智媒与文化新业态的融合之道
齐鲁晚报·齐鲁壹点 管悦 史安琪 郭辰昊 王媛 王鑫11月28日下午,“深改在山东——高质量发展调研行”暨“智驱未来 拥抱变革”齐鲁壹点十周年战略发布活动举行
2024-11-29 00:03:00