模型,偏好,高分,算法,首届,评估头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...导师为教授 Nigel Collier 和 Ehsan Shareghi。他的研究兴趣是大模型和文本评估，数据生成等。共同一作为二年级博士生周涵，导师为教授 Anna Korhonen 和 Ivan Vulić，他的研究兴趣是高效大模型。大模型展现出了卓越的指令跟从和任务泛...……更多

2024-08-06 09:26:00模型,偏好,高分,算法,首届,评估

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖

...计算机学院攻读博士二年级，研究方向为强化学习、扩散模型和大模型对齐。OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展，据业内人士分析披露，其关键技术在于基于强化学习的搜索与...……更多

2024-10-26 09:48:00算法,奖励,理念,问题,技术,模型

这才是真开源模型！公开后训练一切，性能超越Llama 3.1

开源模型阵营又迎来一员猛将：Tülu 3。它来自艾伦人工智能研究所（Ai2），目前包含 8B 和 70B 两个版本（未来还会有 405B 版本），并且其性能超过了 Llama 3.1 Instruct 的相应版本！长达 73 的技术报告详细介绍了后训练的细节。在...……更多

2024-11-26 09:44:00模型,性能,训练,模型,训练,数据

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

苹果AI版iOS首日火爆：聊天秒变高情商，大模型成最强嘴替

...变得儒雅随和：开启Apple Intelligence后，苹果自研的端侧大模型就会被下载到设备当中。根据手快的网友体验反馈，不像其他家的AI那样动不动就是拒绝服务。与此同时，苹果自家大模型的报告也已出炉，披露了大量技术细节。报...……更多

2024-07-31 09:39:00情商,火爆,模型,苹果,模型,苹果

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路：让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

解密OneEntity体系

...采集；清洗，去噪声并统一；反复试用并确定最佳算法及模型；为模型选择计算因子并对模型中的每一个计算因子调配权重；产出标签质量评估报告以辅助验收。我们随机抽查了若干个在用的标签，预估工作量和工作周期，一个...……更多

2024-04-23 06:00:00体系,数据,标签,行为,偏好,业务

贵州“两个算法”入选第五批深度合成服务算法备案

...融合合成算法”、贵州律皓科技有限公司“律皓法管家大模型生成算法”入选。深度合成算法备案旨在规范深度合成服务算法应用，要求深度合成服务提供者和服务技术支持者进行主体备案，并对使用深度合成技术产生的信息内...……更多

2024-05-08 20:01:00算法,贵州,深度,两个,服务,算法

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...enAI放出了一个大招，预热了许久的“草莓”（Strawberry）模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼（Sam Altman）说。这就是名为 o1的新模型，这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

第一波大模型已经走进厨房了！实测方太Healthy Cook

现在，第一波大模型已经走进厨房了！它根据你的个人基础数据、饮食习惯、现有食材等定制健康膳食计划，联动各种设备帮助你完成烹饪全链路的操作。比如通过有视觉感知的AI智慧眼识别食材及操作监测，帮你调控时间，控...……更多

2024-10-26 09:50:00一波,实测,模型,厨房,模型,场景

大模型成私人导游，一键规划Citywalk，港大MIT联合出

现在，大模型可以做私人导游，为你规划Citywalk路线了——港大MIT等单位联合推出ITINERA，将LLM与空间优化相结合，实现个性化的开放域城市行程规划。举个栗子，用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的cityw...……更多

2024-08-05 09:36:00一键,导游,模型,私人,规划,联合

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分，实现了更好的上下文理解。然而，注意力机制的缺点是计算开销大，会随输入规模而二次增长，Transformer 也因此难以处理非常长的文本。...……更多

2024-09-03 09:59:00线性,新作,混合,作者,模型,线性

“多彩宝人脸融合合成算法”入选第五批深度合成服务算法备案

...融合合成算法”、贵州律皓科技有限公司“律皓法管家大模型生成算法”成功入选。深度合成算法备案旨在规范深度合成服务算法应用，要求深度合成服务提供者和服务技术支持者进行主体备案，并对使用深度合成技术产生的信...……更多

2024-05-08 20:02:00算法,人脸,深度,服务,贵州,人脸

建行多个项目荣获首届产融合作数据模型算法大赛奖项

本文转自：中国新闻网近日，首届产融合作数据模型算法大赛总决赛结果正式发布。建设银行累计有21个优秀模型、方案、论文荣获奖项，其中一等奖2个，二等奖6个，三等奖10个，优秀论文3篇，在124个获奖项目中占比17%，高居...……更多

2024-06-12 17:03:00建行,奖项,算法,首届,模型,多个

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

大模型领域的技术发展，今天起再次「从 1 开始」了。大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

3天把Llama训成Mamba，性能不降，推理更快！

...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

Nature重磅：击败人类数学家，AI首次攻破经典数学难题

人工智能（AI）大模型，击败了人类数学家。今天，在 Nature 上发表的一篇论文中，Google DeepMind 的研究团队介绍了一种搜索数学和计算机科学新解决方案的方法——FunSearch，它的工作原理是将预先训练的大型语言模型（LLMs）与...……更多

2023-12-15 14:38:00数学,数学家,重磅,难题,人类,经典

基于统计学方法的消费者行为分析研究

...进一步探索消费者行为背后的因果关系。例如，通过回归模型可以分析价格变化、促销活动等因素对消费者购买决策的影响。聚类分析作为一种无监督学习方法，在消费者行为分析中也发挥着重要作用。通过将消费者按照购买...……更多

2024-06-24 11:32:00分析研究,统计学,消费者,行为,统计,消费

世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效

...慕尼黑工业大学等单位提出DriveDreamer4D，是首个利用世界模型增强 4D 驾驶场景重建效果的工作。DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果，在 user study 实验中获得了超过 80% 的偏好投票，为走向空间智能和 4D 世...……更多

2024-10-30 09:54:00模型,世界,驾驶,场景,突破,效果

中科大联合华为诺亚Entropy Law，揭秘大模型性能、数

...力于推动人工智能领域的技术创新和发展。数据是大语言模型（LLMs）成功的基石，但并非所有数据都有益于模型学习。直觉上，高质量的样本在教授 LLM 上预期会有更好的效率。因此，现有方法通常专注于基于质量的数据选择。...……更多

2024-07-23 09:41:00诺亚,华为,模型,性能,联合,数据

2023金融大模型报告|智能风控：荆棘中有玫瑰

AIGC成为人工智能的新基座，也让通用大模型概念席卷至各行各业。凭借强大的语义理解、语言生成及智能整合能力，金融机构将大模型技术应用于风控体系建设、协助分析客户和市场中的各种非结构化数据、提高风险管理的准...……更多

2023-12-11 13:11:00荆棘,模型,玫瑰,智能,金融,报告

大数据驱动下的金融创新：采集技术优势与应用分析

...部的非传统数据，金融机构能够构建更全面、细致的客户模型，实现更精准的风险评估和更个性化的服务设计。非传统数据的集成使用还有助于金融机构探索新的业务领域，如基于行为数据的信用评分系统，为无信用历史的客户...……更多

2024-04-13 05:53:00优势,驱动,金融,应用,分析,数据

自动化、可复现，基于大语言模型群体智能的多维评估基准

...BZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners，以及……更多

2024-10-23 12:03:00多维,基准,群体,模型,自动化,评估

算法为什么知道“你想看什么”？

...茧房效应”中。在一个更宏观的尺度上，算法推荐服从模型的数学和统计学特性。一个重要的特征是幂律分布。幂律分布是一条向下的、拖着长长尾巴的曲线，描述了在自然世界或人类社会中，“只有少数事务具有极大影响力...……更多

2024-12-07 20:32:00算法,算法,推荐,用户,人们,偏好