• 我的订阅
  • 头条热搜
首届大模型顶会COLM高分论文:偏好搜索算法让大模型评估更高效
...导师为教授 Nigel Collier 和 Ehsan Shareghi。他的研究兴趣是大模型和文本评估,数据生成等。共同一作为二年级博士生周涵,导师为教授 Anna Korhonen 和 Ivan Vulić,他的研究兴趣是高效大模型。大模型展现出了卓越的指令跟从和任务泛...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...计算机学院攻读博士二年级,研究方向为强化学习、扩散模型和大模型对齐。OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展,据业内人士分析披露,其关键技术在于基于强化学习的搜索与...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。在...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
代码模型SFT对齐后,缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...变得儒雅随和:开启Apple Intelligence后,苹果自研的端侧大模型就会被下载到设备当中。根据手快的网友体验反馈,不像其他家的AI那样动不动就是拒绝服务。与此同时,苹果自家大模型的报告也已出炉,披露了大量技术细节。报...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段...……更多
解密OneEntity体系
...采集;清洗,去噪声并统一;反复试用并确定最佳算法及模型;为模型选择计算因子并对模型中的每一个计算因子调配权重;产出标签质量评估报告以辅助验收。我们随机抽查了若干个在用的标签,预估工作量和工作周期,一个...……更多
...融合合成算法”、贵州律皓科技有限公司“律皓法管家大模型生成算法”入选。深度合成算法备案旨在规范深度合成服务算法应用,要求深度合成服务提供者和服务技术支持者进行主体备案,并对使用深度合成技术产生的信息内...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
第一波大模型已经走进厨房了!实测方太Healthy CookingGPT
现在,第一波大模型已经走进厨房了!它根据你的个人基础数据、饮食习惯、现有食材等定制健康膳食计划,联动各种设备帮助你完成烹饪全链路的操作。比如通过有视觉感知的AI智慧眼识别食材及操作监测,帮你调控时间,控...……更多
大模型成私人导游,一键规划Citywalk,港大MIT联合出品
现在,大模型可以做私人导游,为你规划Citywalk路线了——港大MIT等单位联合推出ITINERA,将LLM与空间优化相结合,实现个性化的开放域城市行程规划。举个栗子,用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的cityw...……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分,实现了更好的上下文理解。然而,注意力机制的缺点是计算开销大,会随输入规模而二次增长,Transformer 也因此难以处理非常长的文本。...……更多
...融合合成算法”、贵州律皓科技有限公司“律皓法管家大模型生成算法”成功入选。深度合成算法备案旨在规范深度合成服务算法应用,要求深度合成服务提供者和服务技术支持者进行主体备案,并对使用深度合成技术产生的信...……更多
建行多个项目荣获首届产融合作数据模型算法大赛奖项
本文转自:中国新闻网近日,首届产融合作数据模型算法大赛总决赛结果正式发布。建设银行累计有21个优秀模型、方案、论文荣获奖项,其中一等奖2个,二等奖6个,三等奖10个,优秀论文3篇,在124个获奖项目中占比17%,高居...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于...……更多
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
人工智能(AI)大模型,击败了人类数学家。今天,在 Nature 上发表的一篇论文中,Google DeepMind 的研究团队介绍了一种搜索数学和计算机科学新解决方案的方法——FunSearch,它的工作原理是将预先训练的大型语言模型(LLMs)与...……更多
...进一步探索消费者行为背后的因果关系。例如,通过回归模型可以分析价格变化、促销活动等因素对消费者购买决策的影响。 聚类分析作为一种无监督学习方法,在消费者行为分析中也发挥着重要作用。通过将消费者按照购买...……更多
世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果
...慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...力于推动人工智能领域的技术创新和发展。数据是大语言模型(LLMs)成功的基石,但并非所有数据都有益于模型学习。直觉上,高质量的样本在教授 LLM 上预期会有更好的效率。因此,现有方法通常专注于基于质量的数据选择。...……更多
2023金融大模型报告|智能风控:荆棘中有玫瑰
AIGC成为人工智能的新基座,也让通用大模型概念席卷至各行各业。凭借强大的语义理解、语言生成及智能整合能力,金融机构将大模型技术应用于风控体系建设、协助分析客户和市场中的各种非结构化数据、提高风险管理的准...……更多
...部的非传统数据,金融机构能够构建更全面、细致的客户模型,实现更精准的风险评估和更个性化的服务设计。非传统数据的集成使用还有助于金融机构探索新的业务领域,如基于行为数据的信用评分系统,为无信用历史的客户...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...BZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及……更多
...茧房效应”中。 在一个更宏观的尺度上,算法推荐服从模型的数学和统计学特性。一个重要的特征是幂律分布。幂律分布是一条向下的、拖着长长尾巴的曲线,描述了在自然世界或人类社会中,“只有少数事务具有极大影响力...……更多
沂蒙慧眼系统通过涉企数据和算法模型实现对企业的精准“画像”
...问。记者从会上获悉,沂蒙慧眼系统通过涉企数据和算法模型实现对企业的精准“画像”、精准识别。数据方面:围绕企业全生命周期整合了20多个部门70余项1100余万条内部数据和第三方采购的外部数据,形成了企业基本信息、...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
2023金融大模型报告|重塑金融科技
大模型,成为今年来金融领域的一大热点词,在逐渐渗透至办公、客服、营销、风控、研发等各个场景的过程中,不光刷新了金融机构的作业模式和智能化水平,也给了消费者层面更人性的金融服务和科技体验。 抢占先机大模...……更多
单卡搞定Llama 3.1 405B,让大模型轻松瘦身!超强压缩工具包来了
单卡搞定Llama 3.1(405B),最新大模型压缩工具来了!最近Llama-3.1登上开源顶峰,但其最强的405B版本模型900多GB的内存需求,对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC,能...……更多
更多关于科技的资讯:
史上最热夏天,东北人也撑不住去抢空调了
还没到小暑,长春的气温就达到了36度。在长春人肉肉的印象中,长春的夏天从来没有如此闷热,就算是伏天,温度也从来没有超过35度
2025-07-27 11:33:00
第五届中国新电商大会|周建:构建\
7月27日,第五届中国新电商大会在吉林省延边朝鲜族自治州举行。在开幕式暨主论坛中的主题演讲环节,圆通国际执行董事、总裁周建分享了作为快递物流供应链企业
2025-07-28 00:00:00
第五届中国新电商大会|涂磊:“三二一上链接”的背后
7月27日,第五届中国新电商大会在吉林省延边朝鲜族自治州举行。在开幕式暨主论坛中的主题演讲环节,知名主持人、网络主播代表涂磊动情讲述了“三二一上链接”的背后故事
2025-07-28 00:00:00
【天眼问医】别小瞧配眼镜的这个细节,关乎佩戴体验
当下,科学配镜往往忽视了“试戴”这个不可或缺的细节,影响眼镜佩戴的舒适度。“很多朋友在验光结束后,或者眼镜店配好新镜,感觉戴上能看清就认为可以了
2025-07-28 00:36:00
第五届中国新电商大会|方剑:15万人次见证的IP破圈
7月27日,第五届中国新电商大会在吉林省延边朝鲜族自治州举行。在开幕式暨主论坛中的主题演讲环节,遥望科技总裁方剑分享了自己关于新电商
2025-07-28 00:01:00
299元一节课,90后上门带老年人健身
3个月前,77岁、坐标北京的刘大爷想开始锻炼。年轻时他是个运动达人,50多岁时还会和同事一起爬山;60岁时每周都要出门长跑一次
2025-07-27 22:10:00
廿载同心 链启新章:潍柴后市场20年交流会共绘新蓝图
7月26日,以“廿载同心 链启新章”为主题的潍柴后市场产业化发展20年交流会在潍坊举行。来自全国各地的主机厂代表与渠道合作伙伴
2025-07-27 08:28:00
张煤机跨界创新闯出转型发展新路老牌煤机企业抢来2亿多元家电订单河北日报讯(记者王雪威、许卫兵、郭晓通)接待了一拨又一拨客人
2025-07-27 08:38:00
壹点观察|从“春碗”到“花开”,华光的IP化突围
齐鲁晚报·齐鲁壹点 赵原雪创新是最好的传承。7月17日,在上海国家会展中心的LEC全球授权展上,华光国瓷“花开中国”十二大IP如繁花绽放
2025-07-27 13:20:00
中国吉林网 吉刻APP记者 马春雪 刘源江后期制作 夏浚泷
2025-07-27 18:12:00
中国吉林网 吉刻APP记者 马春雪 刘源江后期制作 夏浚泷
2025-07-27 18:13:00
今年以来 “以旧换新”拉动十堰消费超18.4亿元
十堰广电讯(全媒体记者 何旭 魏俊)今年以来,在“以旧换新”政策刺激下,十堰的汽车、家电、3C数码等领域掀起消费热潮,市商务局最新数据显示
2025-07-27 18:14:00
华南首秀!微灵医疗发布高密度薄膜电极术中唤醒与解码研究成果
导语近日,深圳市第二人民医院手术室内,一片厚度仅0.01mm的“深圳智造”超柔性薄膜电极首次覆盖于本土患者脑皮层——深圳本土企业深圳微灵医疗科技有限公司(简称
2025-07-27 18:27:00
华润万家41周年自有品牌生活节,新品试吃+惊喜价点燃夏日焕新潮
7月18日,华润万家41周年之际,“为生活上点新”自有品牌生活节在深圳百鸽笼门店开启。这场盛会集结了一众当季人气新品,通过丰富的试吃体验与品质好物展示
2025-07-27 18:27:00
加速智能体创新 腾讯云发起Agent应用创新挑战赛
7月27日,在2025世界人工智能大会(WAIC)腾讯论坛上,腾讯云正式宣布启动首届“腾讯云黑客松Agent应用创新挑战赛”
2025-07-27 18:27:00