• 我的订阅
  • 头条热搜
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
新智元报道编辑:乔杨【新智元导读】今天,OpenAI悄悄在博客上发布了一篇新论文——CriticGPT,而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。O...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
新智元报道编辑:乔杨 好困【新智元导读】能抗衡AlphaFold 3的生命科学大模型终于出现了。初创公司Evolutionary Scale AI发布了他们最新的98B参数蛋白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...好数据集 Align-Anything,提供详细的人类偏好注释以及用于批评和改进的精细语言反馈,在增强模型的多模态理解能力的同时,从而实现跨模态的全面评估和改进。全模态大模型与全模态对齐大模型性能的最后一块拼图 人类在日...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...为在单一模型内构建有向无环图(DAG)。DAG由代表命题、批评、精炼和验证的节点组成,边表示它们之间的逻辑关系或依赖关系,边都有方向,不存在任何循环路径。这种无环的特性确保推理过程不受循环依赖的影响,能更真实...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许多人提到,相对...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...有益的。值得一提的是,这篇论文来自 OpenAI 的超级对齐团队,其中几位作者在今年早些时候已经离开 OpenAI,团队也已经分崩离析。其中一位作者透露,这是该团队的最后一篇论文。 一个直观的例子为了提高模型输出的可读性...……更多
硅谷手记|AI抄袭背后的硅谷“不光彩文化”
...证据和对方反应来看,抄袭性质已比较确定”。曼宁发声批评后,斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉,并表示要完全撤下Llama3-V模型。在当前的人工智能热潮中,这个事件引发广泛关注。有观点认为...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...锁了提升SOTA的最大增幅——57%!至于Genie的实际效果,用团队的话来说就是:它可以做到像人类工程师一样解决现实生活中的软件问题。首先,你可以用4种方式让Genie开始工作,分别是提示词、GitHub Issue、Linear Ticket或者API。以...……更多
...具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具,如西湖大学文本智能实验室研发的Fast-DetectGPT。人类的创作与AIGC之间存在哪些差异?AI检测工具如何根据...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
Google DeepMind团队发表了一篇研究论文,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...要阶段,接在预训练和监督微调(SFT)之后。我对RLHF的批评是:它几乎算不上是真正的强化学习,而且我认为这一点没有被广泛理解。强化学习很强大,而RLHF则不然。 让我们来看一个AlphaGo的例子,它的训练用到了实际的RL算...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...程完成这一任务吗?为此,来自图灵奖得主 Yoshua Bengio 的团队提出了全新的视觉问答任务:视觉字幕恢复(Visual Caption Restoration,VCR)。让我们借由这个任务对视觉语言模型的推理能力一探究竟:当前的视觉语言模型距离人类的...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...了这一观点。来自达姆施塔特工业大学和巴斯大学的研究团队发现,GPT 等 LLM 尚无法独立地学习或获得新技能,这意味着它们不会对人类构成生存威胁。他们表示,“涌现能力” 背后的真相或许比科幻电影更富有戏剧性,许多...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...器偏差分析对LLM自动评估器(LLM-as-a-Judge autorater)的常见批评主要涉及他们对某些判断的偏见。通过在自动评估器偏见基准CoBBLEr上评估 FLAMe及其变体,论文发现FLAMe模型比其他流行的LLM自动评估器的偏见要小得多。 CoBBLEr主要测...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...当「第一个吃螃蟹的人」,不发模型是担心可能的带来的批评和负面舆论。一旦有了能将VALL-E转化为产品的方法,或者市场上杀出其他竞品,难道还担心微软有钱不赚吗? 的确如网友所说,从项目页面目前放出的demo来看,很难...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...模型attention计算的额外开销。为了确定最优激活参数量,团队投入大量成本展开实验:训练一系列激活参数范围从10M到1B的模型,使用最高1000亿tokens的训练数据,覆盖100亿到1000亿tokens的不同数据规模。使用isoFLOPs曲线,在固定计...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
Meta版慢思考也来了。田渊栋团队带来新作Dualformer,把快慢思考无缝结合,性能提升还成本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可...……更多
AI “早筛” 癌症,准确区分13种癌症,准确率98.2%,人类尽早治疗癌症还远吗?
...行治疗。日前,来自伦敦帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET,通过观察 DNA 甲基化模式,从非癌组织中识别出 13 种不同类型的癌症(包括乳腺癌、肝癌、肺癌和前列腺癌等),准确率高达 9...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...OpenAI的竞争对手。作为OpenAI创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此...……更多
人工智能为了游戏获胜会“说谎”
...人工智能会欺骗人类?5月13日,美国麻省理工学院的研究团队称,部分人工智能系统已经学会如何欺骗人类,包括部分号称已被训练成乐于助人和诚实的系统。国内AI企业相关负责人指出,AI缺乏对谎言伦理后果的认知,其行为...……更多
...莹利用卷积神经网络技术和实际比赛视频,德国一个研究团队训练出能够识别运动员情绪的AI(人工智能)模型。它根据网球运动员在比赛中的肢体语言识别其情感状态,准确率可达到人类观察者水平。德国卡尔斯鲁厄理工学院...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...起来了~接下来,具体康康获奖论文有哪些~上交大CMU等团队获最佳论文此次共有5项研究成果获得EMNLP’24最佳论文奖。1、An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance(图像能表达千言万语……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...的效果。同时,这类营销方法甚至遭到了谷歌内部员工的批评。截至发稿前,钛媒体App在谷歌官方社交账号上已经承认该视频经过编辑。“出于本演示的目的,为了简洁起见,延迟已减少,Gemini输出也已缩短。”谷歌表示。据悉...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...现实世界中的各种物体进行交互的,由此来自微软的研究团队提出了IGOR。究竟怎样才能学到人类和机器人统一的动作表示呢?IGOR框架解读IGOR框架如下所示,包含三个基础模型:Latent Action Model、Policy Model和World Model。具体来说,...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
近日,清华大学硕士生徐冬阳和所在团队,为了助力自动驾驶技术的进一步发展,他们提出一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...们没有验证模型是否正确,就匆忙进行了发布面对公众的批评,我们没有妥善处理好这些问题我们能够复现最初声称的模型基准测试分数,并正在分享评估代码我们能够复现模型声称自己是Claude的行为,我们从未通过API提供任何...……更多
天工开物 智破难关
...小时的速度跑起来?记者就此采访了“天工”背后的研发团队。灵巧关节扛住运动爆发力“天工”诞生地——北京人形机器人创新中心,研发办公室的布设很简单。一群“80后”“90后”工程师围坐在一张长长的会议桌旁,身边...……更多
火爆全球的Chat GPT,想毁灭人类?
...衍射情况,进而推算出蛋白质分子的结构。如今,DeepMind团队利用Alpha Fold构建了一个包含2亿多种蛋白质3D结构的数据库(几乎囊括了科学界所有已知的植物、细菌、真菌和动物产生的蛋白质),通过神经网络算法学习这些数据,...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...任务的扩散基础模型,由清华大学人工智能研究院 TSAIL 团队构建。当前,机器人领域公认的卡脖子问题是 “不够智能”。许多模型需要人教几十遍才能完成单个任务,面对没教过的情况则 “束手无策”。而 RDT 正是这个 “智能...……更多
更多关于科技的资讯:
小狗散步配备“坐骑”机器狗惊呆路人 网友神回复抢镜了
快科技3月3日消息,近日,四川成都,一则小狗坐机器狗散步的视频引发了网友热议。据视频画面显示,一只白色的小狗稳坐机器狗背部
2025-03-03 17:40:00
贵州发现两栖动物新物种“魏氏纤树蛙”:生活在海拔1600米竹林中
快科技3月3日消息,据报道,近日贵州雷公山国家级自然保护区发现了一种两栖动物新物种——魏氏纤树蛙(Gracixalus weii)
2025-03-03 17:40:00
真我首款可更换镜头概念机公布:10倍无损光学变焦
快科技3月3日消息,真我预热了几天的“影像黑科技”产品终于公布——真我首款可更换镜头概念机。从官方公布的海报来看,真我这款新机采用了大圆形后摄
2025-03-03 17:40:00
抗衰老、延长寿命的追求:NMN全球市场能否面临挑战?
中信证券发布的NMN深度行业研报揭示了中国保健品市场的迅猛发展,过去10年的复合增速高达9.5%。据测算,当前国内每1%保健品人口对应的NMN(β-烟酰胺单核苷酸)市场空间为304亿元
2025-03-03 17:57:00
苹果AI进度严重落后!新版AI Siri要等到iOS 20了
快科技3月3日消息,根据Mark Gurman最新透露,苹果在AI技术开发上遭遇了多项重大挑战,导致许多原计划推出的功能被迫延后
2025-03-03 18:10:00
男子用思域发动机、不锈钢管手搓飞机:仅用10天就成功升空
快科技3月3日消息,日前,有博主发视频称,自己改装本田思域1.5T发动机,使用不锈钢管、手钳、角磨机等用料,花费10天手搓了一台飞机
2025-03-03 18:10:00
官方喊你来当深圳人了:本科、硕士、博士通通有补贴 最高10万
3月3日消息,据国内媒体报道称,深圳就业应届毕业生最高补贴10万。深圳方面表示“百万英才汇南粤”行动计划是省委为广东省实现高质量发展而作出的重大部署
2025-03-03 18:10:00
男子开特斯拉狂飙226km/h还拍视频炫耀遭举报:驾照没了
快科技3月3日消息,近日有男子称,自己因为在群聊中炫耀自己超速行为,被人举报,被处扣驾驶证12分、罚款2000元、驾照吊销2年的处罚
2025-03-03 18:10:00
乌鸦反哺、斑羚飞渡 这些让你感动到哭的故事:都是假的!
在童年的儿歌和故事书中,动物常常被赋予人类的情感和道德:乌鸦反哺彰显孝道,老鹰断喙重生诠释坚韧,斑羚飞渡悬崖谱写牺牲……这些故事承载着文化的期许
2025-03-03 18:10:00
华为打造智能基站:地铁出站秒级降低功率 能耗大降37%
快科技3月3日消息,近日,华为无线网络传来重磅消息,安徽移动携手集团研究院、集团设计院以及华为,于合肥共同打造了规模达千站的无线高阶自智网络示范区
2025-03-03 18:40:00
小米SU7 Ultra民间圈速公布!仅比500万的法拉利SF90慢0.04秒
快科技3月3日消息,今天下午,懂车帝全程直播,联合中国知名车手马青骅在天津V1国际赛车场测试了小米SU7 Ultra的赛道性能
2025-03-03 18:40:00
周鸿祎:DeepSeek会让学渣和学霸的差距越拉越大 且不可逆转
快科技3月3日消息,360集团创始人、董事长周鸿祎今日发视频,谈到了DeepSeek对于普通人的影响。他表示,AI对普通人的影响正在被低估
2025-03-03 18:40:00
周鸿祎再谈DeepSeek:精英人群获得的帮助更大 普通员工反而会退步
快科技3月3日消息,近日,360集团创始人兼董事长周鸿祎在其个人社交账号发布视频,再次谈及了DeepSeek,并介绍了AI普及对大众工作生活的改变和影响
2025-03-03 18:40:00
冯小刚电影《向阳·花》定档4月4日:赵丽颖领衔主演
快科技3月3日消息,冯小刚电影官微发文称,由冯小刚导演、赵丽颖领衔主演的电影《向阳·花》官宣定档4月4日全国上映。官微写道
2025-03-03 18:40:00
日本团队做出世界上最小的射击游戏!纳米粒子立大功
据媒体phys报道,日本名古屋大学工程研究所Takayuki Hoshino教授领导的研究团队,通过实时操控纳米级粒子
2025-03-03 18:40:00