• 我的订阅
  • 头条热搜
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
新智元报道编辑:乔杨【新智元导读】今天,OpenAI悄悄在博客上发布了一篇新论文——CriticGPT,而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。O...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
新智元报道编辑:乔杨 好困【新智元导读】能抗衡AlphaFold 3的生命科学大模型终于出现了。初创公司Evolutionary Scale AI发布了他们最新的98B参数蛋白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...为在单一模型内构建有向无环图(DAG)。DAG由代表命题、批评、精炼和验证的节点组成,边表示它们之间的逻辑关系或依赖关系,边都有方向,不存在任何循环路径。这种无环的特性确保推理过程不受循环依赖的影响,能更真实...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许多人提到,相对...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...有益的。值得一提的是,这篇论文来自 OpenAI 的超级对齐团队,其中几位作者在今年早些时候已经离开 OpenAI,团队也已经分崩离析。其中一位作者透露,这是该团队的最后一篇论文。 一个直观的例子为了提高模型输出的可读性...……更多
硅谷手记|AI抄袭背后的硅谷“不光彩文化”
...证据和对方反应来看,抄袭性质已比较确定”。曼宁发声批评后,斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉,并表示要完全撤下Llama3-V模型。在当前的人工智能热潮中,这个事件引发广泛关注。有观点认为...……更多
...—如何将成千上万张GPU卡串联在一起,让它们充分发挥算力作用。这是“BAT”目前也没有完全解决的问题。数学解题能力靠“打补丁”除了功能增加,GPT-4的文本处理和生成能力也优于ChatGPT。谈及这个大模型的数学水平,赵海笑道:...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...锁了提升SOTA的最大增幅——57%!至于Genie的实际效果,用团队的话来说就是:它可以做到像人类工程师一样解决现实生活中的软件问题。首先,你可以用4种方式让Genie开始工作,分别是提示词、GitHub Issue、Linear Ticket或者API。以...……更多
...具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具,如西湖大学文本智能实验室研发的Fast-DetectGPT。人类的创作与AIGC之间存在哪些差异?AI检测工具如何根据...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
Google DeepMind团队发表了一篇研究论文,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...要阶段,接在预训练和监督微调(SFT)之后。我对RLHF的批评是:它几乎算不上是真正的强化学习,而且我认为这一点没有被广泛理解。强化学习很强大,而RLHF则不然。 让我们来看一个AlphaGo的例子,它的训练用到了实际的RL算...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...程完成这一任务吗?为此,来自图灵奖得主 Yoshua Bengio 的团队提出了全新的视觉问答任务:视觉字幕恢复(Visual Caption Restoration,VCR)。让我们借由这个任务对视觉语言模型的推理能力一探究竟:当前的视觉语言模型距离人类的...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...了这一观点。来自达姆施塔特工业大学和巴斯大学的研究团队发现,GPT 等 LLM 尚无法独立地学习或获得新技能,这意味着它们不会对人类构成生存威胁。他们表示,“涌现能力” 背后的真相或许比科幻电影更富有戏剧性,许多...……更多
国内首个类ChatGPT模型发布,服务器被挤崩
...悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台,邀观众参与内测。看过《流浪地球2》的伙伴应该对MOSS这个名字很熟悉,据悉团队在训练完成第一代模型的时候,正值该片热映,片中的人工智能550W...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...器偏差分析对LLM自动评估器(LLM-as-a-Judge autorater)的常见批评主要涉及他们对某些判断的偏见。通过在自动评估器偏见基准CoBBLEr上评估 FLAMe及其变体,论文发现FLAMe模型比其他流行的LLM自动评估器的偏见要小得多。 CoBBLEr主要测...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...当「第一个吃螃蟹的人」,不发模型是担心可能的带来的批评和负面舆论。一旦有了能将VALL-E转化为产品的方法,或者市场上杀出其他竞品,难道还担心微软有钱不赚吗? 的确如网友所说,从项目页面目前放出的demo来看,很难...……更多
AI “早筛” 癌症,准确区分13种癌症,准确率98.2%,人类尽早治疗癌症还远吗?
...行治疗。日前,来自伦敦帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET,通过观察 DNA 甲基化模式,从非癌组织中识别出 13 种不同类型的癌症(包括乳腺癌、肝癌、肺癌和前列腺癌等),准确率高达 9...……更多
人工智能为了游戏获胜会“说谎”
...人工智能会欺骗人类?5月13日,美国麻省理工学院的研究团队称,部分人工智能系统已经学会如何欺骗人类,包括部分号称已被训练成乐于助人和诚实的系统。国内AI企业相关负责人指出,AI缺乏对谎言伦理后果的认知,其行为...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...OpenAI的竞争对手。作为OpenAI创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此...……更多
...莹利用卷积神经网络技术和实际比赛视频,德国一个研究团队训练出能够识别运动员情绪的AI(人工智能)模型。它根据网球运动员在比赛中的肢体语言识别其情感状态,准确率可达到人类观察者水平。德国卡尔斯鲁厄理工学院...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...的效果。同时,这类营销方法甚至遭到了谷歌内部员工的批评。截至发稿前,钛媒体App在谷歌官方社交账号上已经承认该视频经过编辑。“出于本演示的目的,为了简洁起见,延迟已减少,Gemini输出也已缩短。”谷歌表示。据悉...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
近日,清华大学硕士生徐冬阳和所在团队,为了助力自动驾驶技术的进一步发展,他们提出一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类...……更多
天工开物 智破难关
...小时的速度跑起来?记者就此采访了“天工”背后的研发团队。灵巧关节扛住运动爆发力“天工”诞生地——北京人形机器人创新中心,研发办公室的布设很简单。一群“80后”“90后”工程师围坐在一张长长的会议桌旁,身边...……更多
火爆全球的Chat GPT,想毁灭人类?
...衍射情况,进而推算出蛋白质分子的结构。如今,DeepMind团队利用Alpha Fold构建了一个包含2亿多种蛋白质3D结构的数据库(几乎囊括了科学界所有已知的植物、细菌、真菌和动物产生的蛋白质),通过神经网络算法学习这些数据,...……更多
机器人笑了,我却笑不出来
...tive Machines Lab)的博士生胡宇航说道。在2021年,他和研究团队还开发了一个名叫Eva的机器人,这是首批能够自我模仿人类面部表情的机器人之一。从Eva到Emo,我们可以看到机器人在模仿人类面部表情方面实现了显著的进步。机器...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
....正如开头所述,能够把苹果AI装进终端设备,背后是来自团队自研的基础模型,在发光发热。iPhone的AI革命:30亿参数装进口袋具体来说,AFM是一款基于Transformer架构的仅解码器稠密模型。其设计思路如下:共享输入/输出嵌入矩...……更多
OpenAI官宣下一代更接近AGI模型开始训练!成立新委员会把控 AI 安全
...nAI前首席科学家 Ilya Sutskever和 Jan Leike曾是 OpenAI 超级对齐团队的领导者,该团队负责确保 AI 与预期目标保持一致,他们于本月初离开了公司。随着两位领导的离开,超级对齐团队已被解散,将纳入其他研究工作当中。据消息人...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...能让人类水平限制LLM的进一步发展。今年1月,Meta和NYU的团队就提出了语言模型的自我奖励机制,使用LLM-as-a-Judge的提示机制,让模型在训练期间进行自我反馈。论文地址:https://arxiv.org/abs/2401.10020论文发现,即使不依靠人类标注...……更多
RLHF不够用了,OpenAI设计出了新的奖励机制
...绝应「包含简短的道歉」并且「应说明无法遵从」。研究团队设计了三类期望的模型行为,用于处理有害或敏感的话题。根据安全政策,不同的请求对应不同的模型响应类型。 图中内容由 AI 工具翻译,仅供参考。以下是一些命...……更多
更多关于科技的资讯:
华为Mate 70 Pro稳了,这价格很难拒绝啊
听说了吗?华为Mate70Pro即将震撼来袭!这可不是一般的升级,简直是要颠覆手机界的大动作!准备好你们的钱包,我们一起来围观这场科技盛宴
2024-10-06 16:33:00
上市两月狂降1000元,卫星通信手机白菜价了?
各位手机控们,今天咱们要聊的可是努比亚Z60SPro,这款手机简直是为冒险者量身定制的!7月末开售,搭载高通骁龙8Gen2处理器
2024-10-06 16:33:00
一加13与真我GT 7 Pro:旗舰手机大战的前奏
国庆假期一结束,智能手机市场就要热闹起来了!一加和真我(realme)这对“好基友”即将迎来一场旗舰机大战。根据最新的消息
2024-10-06 16:33:00
华为节后大动作!爆nova 13系列10月22日发布
九月的华为真是热闹非凡,接连两场发布会让人眼花缭乱!新推出的华为MateXT三折叠屏手机、华为WATCHGT5智能手表
2024-10-06 16:33:00
iPhone SE4即将投产,这次苹果又要搞啥?
果粉们!随着iPhone16系列的横空出世,关于它的评价也是各执己见,但有一件事情我们不能忽视:苹果又要搞事情了!根据国外媒体的爆料
2024-10-06 16:34:00
三胞胎宝宝坐高铁买挂票:可爱溢出屏幕
10月6日消息,据媒体报道,吉林长春三胞胎宝宝乘坐高铁引发关注,三位宝宝买的“挂票”,全程不哭不闹,等爸爸喂辅食,据悉
2024-10-06 16:38:00
亚马逊计划裁员1.4万管理人员!预计节省30亿美元成本
快科技10月6日消息,据摩根士丹利报告称,亚马逊计划在明年初之前裁减约1.4万个管理职位,以每年节省约30亿美元(约合211
2024-10-06 16:38:00
男子第一次上高速上演迷惑操作:倒车加逆行被扣24分
快科技10月6日消息,高速路上倒车将被罚12分,逆行同样是12分,那如果又倒车又逆行,合计将被扣24分。近日,山东德州
2024-10-06 17:38:00
90后女孩和82岁爷爷成忘年交:今年国庆带着老公孩子一起来探望
10月6日消息,据媒体报道,一位90后女孩自驾赶往山东莱州,看望自己的老朋友——一位82岁的爷爷。当事人贾女士说,与爷爷相识在2018年
2024-10-06 17:38:00
延续简约风格!OPPO Find X8包装盒公开亮相:天地盖设计
快科技10月6日消息,今日OPPO周意保分享了Find X8包装盒,延续了此前的简约设计风格,并采用天地盖设计。从图中可以看出
2024-10-06 17:38:00
华为WATCH Ultimate绿野传奇未搭载玄玑感知系统
10月5日消息,华为WATCHUltimate于今年9月在海外推出绿色配色(其国行命名预计为华为WATCHUltimate绿野传奇)
2024-10-06 12:57:00
华为pura70系列又降价了,最高降价幅度达到千元
华为从去年8月重新回归后,市场份额快速攀升,用时仅一年时间再次超过OV小米荣耀,成为国内第一,这还是在中低端手机缺失5G的情况下
2024-10-06 13:05:00
amd锐龙79800x3d性能曝光,多核性能提升幅度不小
AMD已经发布了锐龙9000系处理器,不过对于游戏玩家来说,大家更加期待的应该就是X3D系列处理器,毕竟X3D系列处理器拥有更大的缓存
2024-10-06 13:07:00
哀牢山本地人:进山要怀着敬畏之心
10月6日消息,据媒体报道,近日,一名博主独自进哀牢山收集材料的视频引发关注。一位哀牢山本地人表示,本地的老百姓会经常进山捡菌子
2024-10-06 13:08:00
入职仅1年!理想内部人员确认宋紫薇离职:飞书已无法搜到
快科技10月6日消息,近日有网友爆料称,宋紫薇已从理想汽车离职,目前离职原因未知。据凤凰网科技报道,目前已经有知情人士确认此事
2024-10-06 13:08:00