• 我的订阅
  • 头条热搜
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
如果 AI 模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...一篇新论文——CriticGPT,而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。OpenAI最近的拖延症状逐渐严重,不仅GPT-5遥遥无期,前几天还宣布GPG-4o的...……更多
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...,OpenAI还搞出了新鲜玩法——在“超级对齐”团队的一篇遗作中,使用了参数量为大模型千分之一或百分之一的小模型,来对大模型进行优化。 实验中,大小两个模型相互“博弈”,大模型需要不断优化调整自己的输出,让小...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...[2]都采取了自我纠正的方法。传统的大语言模型,因为在输出答案的时候是逐个Token输出,当输出长度较长时,中间某些Token出错是必然发生。但即使LLM后来知道前面输出的Token错了,它也得用更多错误来“圆谎”,因为没有机制...……更多
梦想当燃|浪潮云海若大模型团队:从“0”开始,前进不会止步
...局限性和实时性方面的问题,从而生成更准确、更丰富的输出结果。同时,团队也突破了提示工程技术,实现了精确引导大模型输出的能力,帮助大模型更准确地理解人类需求、生成更符合人类期望的结果。团队成员还突破了语...……更多
重磅!国产AI写作模型比ChatGPT强1000%,360前员工AI团队取得重大突破
...成,最核心的优势在于可一键生成超20000字内容,长文本输出能力要比ChatGPT多10倍。今年上半年,Moonshot AI、阿里、360等一众大模型厂商纷纷开卷长文本,但这个“长文本”是指长文本处理能力,是 “喂进”大语言模型进行处理...……更多
大模型集体失控!南洋理工新型攻击,主流AI无一幸免
...大模型的防御手段:有的防御机制只查输入,有的则check输出;有的只查关键词,但也有整句话意思都查的,等等。例如,作者们检查后发现,相比ChatGPT,Bing Chat和Bard的防御机制,会对大模型输出结果进行检查。相比“花样百...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...GPU小时(105-107个),并分布在多个GPU上进行。预训练的输出模型称为「基础模型」。继续预训练继续预训练(也称为第二阶段预训练)将使用全新的、未见过的领域数据进一步训练基础模型。 这里,同样使用与初始预训练相同...……更多
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
...丢给模型一个俄罗斯复活节彩蛋图片作为输入,Tripo 2.0的输出效果最有“浮雕感”,对比来看,纹理细节都是最精致的:进行多次测试后,不难发现Tripo 2.0在全方位的生成表现上都有显著差异。 比如生成的PBR材质具有⾼保真度...……更多
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
...出了一个两次重加权框架,分别对草稿模型和目标模型的输出分布进行重加权。这个框架具有很高的自由度,两次重加权函数可以不同,验证算法也可以任意选择,只要满足最终算法保持输出概率分布,从而维持输出质量即可。...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...与人类的意图相对齐、研究如何通过不同对齐算法让模型输出更符合人类预期和价值观具有重要意义。该框架的独特之处在于:1)Align-Anything 框架支持文本、图像、音频、视频等多种模态的输入和输出对齐,这在目前开源社区...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...丢弃整个轨迹并鼓励 Transformer 绕过所有中间步骤,直接输出最终解答。在训练时,他们的策略是随机选择这些结构化的轨迹丢弃策略。前提准备他们的这项研究基于田渊栋团队之前的另一项研究《Beyond A*: Better planning with transform...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
... Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉约束提高学习效率和准确性。多模态大模型展现出了多种多样的能力,这些能力都通过SFT和预训练从庞大的训练数据集中学习。但是...……更多
百度CTO王海峰:文心大模型的底色和成色
...多益善。为提升大模型的准确性,文心大模型4.0在输入、输出两个阶段都运用了知识点增强,具体做法为在输入端对用户输入的问题进行理解,并拆解所需的知识点,然后在搜索引擎、知识图谱、数据库中获取准确知识,最后把...……更多
“3D视频版Sora”来了!
...型的多视角视频生成。其输入为单个物体的单视角视频,输出为同一物体8个不同角度的多视角视频。据介绍,该模型以图生视频模型Stable Video Diffusion(SVD)为基础,实现了从图生视频到视频生视频的能力飞跃。具体运行时,用...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...ion)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,不展示思考过程。TPO将思维链式提示/推理融入训练中:在回答之前,用思维链式方法进行思考;使用一个LLM评判来评估响应(不包括由LL...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
...个混合层和末端的线性层组成。该模型以坐标作为输入并输出信号值。数据最初进入混合层,从 Linear 层和 BatchNorm 层开始,得到:然后被输入到数据重新上传量子电路 QC 中。在图 2 (b) 和 (c) 中,我们给出了参数层和编码层量子...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...实验的准确性,他们还进行了偏见控制,通过调整提示和输出格式,确保非指令微调模型的公平性,并通过手动评估验证模型输出的准确性。 在实验中,研究人员采用 zero-shot 和少样本(few-shot)两种设置,重点分析了 GPT 的表...……更多
大模型越狱,价值百亿的猫鼠游戏|Future
...手机一样,绕过大模型本身的一些限制,可能误导大模型输出违法甚至是有害的内容。考虑到大模型正在广泛融入到人们的工作、学习和生活之中,越狱如果泛滥,将产生更多不可预测的连锁反应。对AI从业者来说,只有把越狱...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...测试的原始迭代没有考虑效率,因为 vanilla LLM 生成某些输出所花费的时间仅取决于该输出的长度,而与实例的语义内容或难度无关。不过作者也对各个模型的提示成本进行了比较,如表格 4 所示。 从近似检索到近似推理:评估...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...行Python代码,并从结果中迭代学习,直到达到所需的最终输出。执行沙盒不连接互联网,并标配一些数值库,开发者只需根据模型的输出token进行计费。这是谷歌在模型功能中首次引入代码执行的步骤,今天即可通过Gemini API和Goo...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...当用户额外输入一张纯色无关图片时,模型按照用户要求输出了虚假新闻。这意味着多模态大模型相比大语言模型,有着更多的风险挑战。除了这两个例子以外,多模态大模型还存在幻觉、偏见、隐私泄漏等各类安全威胁或社会...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...大模型可以支持文本、图片、 音频、视频多模态输入和输出 。目前,若愚·九天多模态大模型已经在垂直领域进行了细分应用。若愚科技打造的机器人大脑产品 若愚·九天大模型也针对机器人应用场景进行了专门的训练。“若...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...型深度模型训练后仅适合单一任务和场景,具有固定输入输出长度,适配的变量数等难以泛化的性质,难以像大语言模型一样,适用于各类下游任务,例如T5,LLaMA和BLOOM等。 (3)可扩展性:大模型关键特征之一在于Scaling Law:...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...的、无需深度学习基础和生化知识先验的统一型分子交互输出平台。这意味着,通过进一步地收集和吸纳数量更多的、覆盖面更广的分子交互任务,MolTC 可以显式地、高效地学习通用的分子交互底层范式和机制,从而更精确地把...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出的偏好来对 LLM 进行综合排名。然而,随着 LLM 逐渐落地于众多应用场景,无论是针对工业生产目标,还是科学场景辅助需求,评估 LLM 在精细化维度上的能力都是至关...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...三,新加坡国立大学尤洋团队提出了业内第一种可以实时输出的,基于 DiT 的视频生成方法。该技术名为 Pyramid Attention Broadcast (PAB)。通过减少冗余注意力计算,PAB 实现了高达 21.6 FPS 的帧率和 10.6 倍的加速,同时不会牺牲包括...……更多
...。02EDA数据分析报告基于ray实现分布式自动EDA分析工具,输出用户需要的EDA分析报告内容提供用户参考。03自动建模基于ray实现分布式自动调参,提升模型调参效率,支持单模型调参与自动模型集成。可根据用户自定义约束指标...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进行交互成为可能。然而,开源社区对于构建此类基于 LLM 的语音交互模型仍然缺乏探索。实现与 LLM 进行语音交互...……更多
用大模型一站式解决企业服务难题,「安安创新」完成1500万天使轮融资|36氪首发
...等AI工具进行智能诊断,结合自主知识图谱+专家知识库,输出专业解决方案。公司的核心创始团队来自国内外知名院校,具备传播、金融、法律、管理等多元背景,在主导企业上市、智能科技应用等领域有着丰富的经验和资源。...……更多
更多关于科技的资讯:
上海迪拜同发讯飞AI翻译耳机 “中国技术”连接全球
大皖新闻讯 一个是中国对外开放的前沿窗口,一个是中东地区商业中心和“一带一路”重要节点城市,10月14日下午,科大讯飞在上海世界会客厅举行“对话世界
2025-10-15 17:21:00
近日,一批仿冒新闻机构的自媒体账号被依法关闭,据报道,这些账号以“新闻”为名,行“带货”之实。但记者调查发现,此类“李鬼”账号仍在各大平台潜伏
2025-10-15 17:59:00
蛋糕里吃出“牙”,和解填不满食品安全的信任缺口
齐鲁晚报·齐鲁壹点评论员 刘雅菲10月14日,有上海网友发布视频称,自己在上海的山姆会员商店外高桥店购买的枣泥核桃蛋糕中
2025-10-15 16:00:00
三联家电&海信集团强强联手!10.25重磅惠民活动即将启幕
鲁网10月15日讯为抢占四季度消费市场高地,深化品牌战略合作布局,10月11日,山东三联家用电器有限公司与海信集团联合召开“三联家电10
2025-10-15 14:59:00
京东官宣发布新车,称像买手机一样方便,已注册多枚京东汽车商标
10月14日,京东微博账号发文称:2025京东11.11期间,京东联合广汽、宁德时代将正式推出一款神秘国民好车,官方将在10月底将陆续开启内测版
2025-10-15 10:46:00
固安:开足马力赶订单 满足京津冀市场需求
河北新闻网讯(万倩、陈放)10月13日,走进位于固安县固安镇的秋兹科技(固安)有限公司生产车间,自动化裁切设备高速运转
2025-10-15 09:56:00
参展企业334家,展位数再创新高达840个斩获银奖!“南京智造”闪耀广交会南报网讯(记者黄琳燕通讯员宁商轩)第138届广交会将于10月15日在广州开幕
2025-10-15 08:09:00
“云”上调度 雨中守护|雷沃数智化服务为抢收装上智慧大脑
秋收关键期遭遇连绵阴雨,让秋收秋种受阻。除了满足抢收抢烘抢播的智能农机,潍柴雷沃还创新数智化服务,通过智能调度与精准服务
2025-10-15 01:05:00
茶酒融合催生“微醺”新赛道,新茶饮品牌争饮“昼夜”经济
当白天的提神茶饮与夜晚的放松酒品打破边界,正催生出国内消费市场一股新的“微醺”风潮。近期,茶百道经典白酒奶茶回归即创下销量佳绩
2025-10-14 11:33:00
嘎子谢孟伟被执行超1400万,已被限高,此前因穿警服带货被行拘7日
近日,因穿警服直播带货被行政拘留、账号遭封禁的嘎子谢孟伟发视频称 “我回来了”,并向所有观众诚恳道歉。视频中,其透露公司员工已被安排回老家
2025-10-14 11:33:00
平谷将打造全国农业科创中心
原标题:世界农业科创大会开幕 农业中关村核心区2.0发布平谷将打造全国农业科创中心本报讯(记者 赵婷婷)昨天,2025世界农业科技创新大会(WAFI)在北京平谷开幕
2025-10-14 11:59:00
据大象新闻报道,近期蜜雪冰城的小票成了年轻人追捧的“追更凭证”,其上连载着名为《雪王在古代卖咖啡》的小说,20个章节随机印在消费小票上
2025-10-14 12:10:00
电通创意发布《2025首席营销官报告》:算法与人性的重构力量
AI时代,品牌的长期价值回归于人性与文化共鸣,人类的创造力、同理心与文化相关性愈加重要。•AI已成日常:几乎所有CMO都在使用AI
2025-10-14 13:29:00
近日,一则“美团外卖骑手能屏蔽顾客”的消息在网络上引发热议。据媒体报道,美团已在福建晋江、浙江绍兴等七个城市试点上线骑手评价用户和屏蔽用户功能
2025-10-14 13:40:00
这座产业园一年制造千万颗球胆、百万颗整球——沂南县“造球记”
齐鲁晚报·齐鲁壹点 记者 公绪成 李其峰 通讯员 陈婉塑炼、分切、热压......沂南县泽辉体育产业园内,工人们正紧忙制作新一批篮球内胆10月9日
2025-10-14 15:00:00