• 我的订阅
  • 头条热搜
首届大模型顶会COLM高分论文:偏好搜索算法让大模型评估更高效
...导师为教授 Nigel Collier 和 Ehsan Shareghi。他的研究兴趣是大模型和文本评估,数据生成等。共同一作为二年级博士生周涵,导师为教授 Anna Korhonen 和 Ivan Vulić,他的研究兴趣是高效大模型。大模型展现出了卓越的指令跟从和任务泛...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...计算机学院攻读博士二年级,研究方向为强化学习、扩散模型和大模型对齐。OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展,据业内人士分析披露,其关键技术在于基于强化学习的搜索与...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...变得儒雅随和:开启Apple Intelligence后,苹果自研的端侧大模型就会被下载到设备当中。根据手快的网友体验反馈,不像其他家的AI那样动不动就是拒绝服务。与此同时,苹果自家大模型的报告也已出炉,披露了大量技术细节。报...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段...……更多
解密OneEntity体系
...采集;清洗,去噪声并统一;反复试用并确定最佳算法及模型;为模型选择计算因子并对模型中的每一个计算因子调配权重;产出标签质量评估报告以辅助验收。我们随机抽查了若干个在用的标签,预估工作量和工作周期,一个...……更多
...融合合成算法”、贵州律皓科技有限公司“律皓法管家大模型生成算法”入选。深度合成算法备案旨在规范深度合成服务算法应用,要求深度合成服务提供者和服务技术支持者进行主体备案,并对使用深度合成技术产生的信息内...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
第一波大模型已经走进厨房了!实测方太Healthy CookingGPT
现在,第一波大模型已经走进厨房了!它根据你的个人基础数据、饮食习惯、现有食材等定制健康膳食计划,联动各种设备帮助你完成烹饪全链路的操作。比如通过有视觉感知的AI智慧眼识别食材及操作监测,帮你调控时间,控...……更多
大模型成私人导游,一键规划Citywalk,港大MIT联合出品
现在,大模型可以做私人导游,为你规划Citywalk路线了——港大MIT等单位联合推出ITINERA,将LLM与空间优化相结合,实现个性化的开放域城市行程规划。举个栗子,用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的cityw...……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分,实现了更好的上下文理解。然而,注意力机制的缺点是计算开销大,会随输入规模而二次增长,Transformer 也因此难以处理非常长的文本。...……更多
...融合合成算法”、贵州律皓科技有限公司“律皓法管家大模型生成算法”成功入选。深度合成算法备案旨在规范深度合成服务算法应用,要求深度合成服务提供者和服务技术支持者进行主体备案,并对使用深度合成技术产生的信...……更多
建行多个项目荣获首届产融合作数据模型算法大赛奖项
本文转自:中国新闻网近日,首届产融合作数据模型算法大赛总决赛结果正式发布。建设银行累计有21个优秀模型、方案、论文荣获奖项,其中一等奖2个,二等奖6个,三等奖10个,优秀论文3篇,在124个获奖项目中占比17%,高居...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于...……更多
算法之「恶」:如何挣脱推荐系统的「囚禁」?
...千的量级),不然精排阶段会非常耗时,精排一般都采用模型进行排序,比如LR(线性回归),LR+GBDT(线性回归+树模型),FM(因子分解模型),DNN(深度学习模型)等,排序后候选内容池会到百量级。这些排序策略和模型的输...……更多
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
人工智能(AI)大模型,击败了人类数学家。今天,在 Nature 上发表的一篇论文中,Google DeepMind 的研究团队介绍了一种搜索数学和计算机科学新解决方案的方法——FunSearch,它的工作原理是将预先训练的大型语言模型(LLMs)与...……更多
世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果
...慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世...……更多
...进一步探索消费者行为背后的因果关系。例如,通过回归模型可以分析价格变化、促销活动等因素对消费者购买决策的影响。 聚类分析作为一种无监督学习方法,在消费者行为分析中也发挥着重要作用。通过将消费者按照购买...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...力于推动人工智能领域的技术创新和发展。数据是大语言模型(LLMs)成功的基石,但并非所有数据都有益于模型学习。直觉上,高质量的样本在教授 LLM 上预期会有更好的效率。因此,现有方法通常专注于基于质量的数据选择。...……更多
2023金融大模型报告|智能风控:荆棘中有玫瑰
AIGC成为人工智能的新基座,也让通用大模型概念席卷至各行各业。凭借强大的语义理解、语言生成及智能整合能力,金融机构将大模型技术应用于风控体系建设、协助分析客户和市场中的各种非结构化数据、提高风险管理的准...……更多
...部的非传统数据,金融机构能够构建更全面、细致的客户模型,实现更精准的风险评估和更个性化的服务设计。非传统数据的集成使用还有助于金融机构探索新的业务领域,如基于行为数据的信用评分系统,为无信用历史的客户...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...BZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及……更多
沂蒙慧眼系统通过涉企数据和算法模型实现对企业的精准“画像”
...问。记者从会上获悉,沂蒙慧眼系统通过涉企数据和算法模型实现对企业的精准“画像”、精准识别。数据方面:围绕企业全生命周期整合了20多个部门70余项1100余万条内部数据和第三方采购的外部数据,形成了企业基本信息、...……更多
单卡搞定Llama 3.1 405B,让大模型轻松瘦身!超强压缩工具包来了
单卡搞定Llama 3.1(405B),最新大模型压缩工具来了!最近Llama-3.1登上开源顶峰,但其最强的405B版本模型900多GB的内存需求,对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC,能...……更多
2023金融大模型报告|重塑金融科技
大模型,成为今年来金融领域的一大热点词,在逐渐渗透至办公、客服、营销、风控、研发等各个场景的过程中,不光刷新了金融机构的作业模式和智能化水平,也给了消费者层面更人性的金融服务和科技体验。 抢占先机大模...……更多
老板电器与方太放大招!AI厨电起风了:前路漫漫亦灿灿
...杂、更多元化的需求。老板电器也同样在其「食神」AI大模型上投入大量资源。今年6月,老板电器发布了专注于烹饪领域的AI大模型——食神大模型,覆盖了消费者在烹饪前、烹饪中、烹饪后三个阶段的使用场景。图/老板电器正...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
...实现中国式现代化需要解决好的一个重大问题。文生视频模型Sora,是继ChatGPT之后又一推动传播智能化的重要成果,在国际传播领域具有巨大潜力和发展空间。科学认识并正确运用Sora等人工智能技术,对于增强我国国际传播影响...……更多
更多关于科技的资讯:
华为Mate 70一小时预订量已破百万:门店出现排队长龙
快科技11月18日消息,今天12:08,华为Mate 70系列正式开启预订。根据华为商城界面显示,华为Mate 70系列一小时预订量已破百万
2024-11-18 14:22:00
极速454km/h!亿万豪车布加迪W16 Mistral创下敞篷车极速世界纪录
快科技11月18日消息,布加迪W16 Mistral以454公里/小时的速度刷新了敞篷车极速世界纪录,成为全球最快的敞篷车
2024-11-18 14:22:00
本文转自:人民网-河北频道走进河北大名永创通达机械设备有限公司车间,智能机械臂灵活挥舞着,精准地抓取、放置物品,生产线上一片忙碌景象
2024-11-18 14:24:00
新疆以旧换新补贴活动上线 来京东购电脑至高立减2000元
近日,新疆以旧换新补贴活动上线,政府对家电、电脑八大品类发放补贴,电脑品类包括笔记本、台式机、游戏本等符合一级、二级能效的产品
2024-11-18 14:25:00
本文转自:人民网-北京频道人民网北京11月18日电 (记者李博)北京市经济和信息化局、市科委、中关村管委会、市卫健委、市医保局
2024-11-18 14:34:00
联想发布全新液冷品牌“联想问天海神”
本文转自:人民网在11月15日召开的第六届中国超级算力大会上,联想集团发布“联想问天海神”液冷品牌。该品牌聚焦国内市场
2024-11-18 14:35:00
甄选美食·品味全球丨FHC金苹果奖见证“山楂树下”品牌力量
**FHC上海环球食品展于上海新国际博览中心盛大开幕**2024年11月12日,第27届FHC上海环球食品展于上海新国际博览中心盛大开幕
2024-11-18 14:39:00
作者:郑琦在数字化浪潮的席卷下,“双11”已不仅仅是一个简单的购物节,它成为了中国电商经济与物流体系高效协同的年度大考
2024-11-18 14:39:00
江苏省苏北首家绿电绿证市级平台成立
11月6日上午,宿迁绿电绿证市级平台揭牌仪式在国网宿迁供电公司营业厅举行,苏北首家绿电绿证市级平台正式成立。宿迁绿电绿证市级平台包含绿电绿证服务中心和绿电绿证服务站
2024-11-18 14:45:00
顶流预定!华为余承东开通微信视频号
快科技11月18日消息,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东今日正式入驻微信视频号平台。余承东视频号的首秀尤为引人注目
2024-11-18 14:53:00
全新《柯南》动画上线:侦探与怪盗抢王者水晶
快科技11月18日消息,《王者荣耀》与经典侦探动画《名侦探柯南》的跨界联动——“消失的峡谷水晶”已经登场,这一合作项目无疑点燃了广大粉丝的热情
2024-11-18 14:53:00
没信号也不怕 小米SU7自动泊车等智驾在地库都能用
快科技11月18日消息,有车主好奇,小米SU7的智能驾驶功能在没有信号的地下车库是否还能正常使用,尤其是自动泊车功能。对此
2024-11-18 14:53:00
特斯拉辟谣FSD入华授权上汽:仍在评估当中
快科技11月18日消息,特斯拉中国近日否认了有关与上汽就FSD(全自动驾驶)技术授权进行讨论的传闻,明确表示这些消息不实
2024-11-18 14:53:00
本文转自:人民网人民网讯 据阿联酋通讯社11月18日报道,第七届信号处理与信息安全国际会议日前在迪拜大学举办,会议旨在提升学生
2024-11-18 14:54:00
上新“学术搜索” 夸克成为年轻人PC端首选AI应用
近日,夸克发布“学术搜索”AI产品,依托AI技术和亿级学术文献,将大大提高学术工作中信息获取、创作和处理的效率。PConline最新数据显示
2024-11-18 14:54:00