• 我的订阅
  • 头条热搜
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...作,现任TikTok机器学习工程师;詹忆冰,京东探索研究院算法科学家。本文的通讯作者是武汉大学计算机学院教授、博士生导师、国家特聘青年专家罗勇。第一作者为张子屹,目前在武汉大学计算机学院攻读博士二年级,研究方...……更多
打造高品质游戏 - 云上分布式AI实践
...中需要AI机器人的原因和挑战,以及强化学习的核心技术和算法。演讲重点介绍了亚马逊云科技如何支持游戏开发商实现AI虚拟玩家、自动化测试、实时决策优化和虚拟角色行为等功能,带来高效、高覆盖率和个性化的优势。这个演...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
... 和 RM-Max 组合进行选择。我们的框架允许我们在多种搜索算法中进行选择,例如 Beam Search、Best-of-N, 蒙特卡洛树搜索等。每种算法在 PRM 的质量上有其独特的优势。复杂的搜索算法在处理更难的任务时可能表现更好,而简单的方...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...:应用控制理论的原则来设计出能满足安全性要求的 RL 算法。 形式化方法:利用形式化验证工具来确保策略的安全性。2. 无模型的安全强化学习方法:无模型的方法则不依赖于精确的环境模型,而是直接通过与环境的交互来进...……更多
波士顿大学提出无尺度强化学习算法,能用于金融交易和自动驾驶
...究的一个痛点是,为了保证学习率能被合适地设定,现有算法需要对奖励或惩罚的规模需要被限制。举例来说,对于现有的绝大数强化学习问题,一个默认的假设是奖励或惩罚对应的值位于 [-1, 1] 之间。在这种情况下,如果输入...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...多轮训练范式、使用人类数据 + 合成数据、使用多个训练算法和训练目标。也正因为此,这些模型的通用性能和专业能力都非常强。但遗憾的是,他们都没有透明地公开他们的训练数据和训练配方。到目前为止,开源后训练一直...……更多
北京经开区:加快打造AI原生产业创新高地,每年发放1亿元...
...体目标到2026年,人工智能核心技术取得重大突破,算力算法数据有效支撑,场景赋能的广度和深度全面拓展,数据要素市场化建设成效显著,全面构建自主可控软硬件人工智能产业生态。培育性能达到国际先进水平的通用大模...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...作帮助、工具使用和代码。另外,苹果也研发了许多自研算法,为提高模型表现提供了加持,具体信息也在报告中被披露。还有细心的网友从中发现了华点——苹果大模型的训练用的是谷歌TPU集群,英伟达含量竟然为零。Siri升...……更多
首届大模型顶会COLM高分论文:偏好搜索算法让大模型评估更高效
...出了将评估问题转换成偏好排序问题,从而设计了 PairS 算法,一个可以从成对偏好(pairwise preference)中搜索和排序的算法。通过利用不确定性和 LLM 传递性(transitivity)的假设,PairS 可以给出高效,准确的偏好排序,并在多个...……更多
...北京4月25日电 (记者赵竹青)4月23日,2024年第三届琶洲算法大赛正式启动。本届大赛由广州市人民政府、中国人工智能学会联合主办,通过设置算法优选赛、创新应用赛、AI大模型挑战赛等多个组别的比赛,促进人工智能算法...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...模态大模型与人类的意图相对齐、研究如何通过不同对齐算法让模型输出更符合人类预期和价值观具有重要意义。该框架的独特之处在于:1)Align-Anything 框架支持文本、图像、音频、视频等多种模态的输入和输出对齐,这在目...……更多
交行副行长钱斌:生成式AI在算力算法、数据安全等领域面临...
...技术在金融领域的落地应用。钱斌指出,生成式AI在算力算法、数据安全、人才等领域面临着诸多痛点和难点。比如,如何实现大规模算力模式下的绿色低碳供给,如何提供适合大模型的大规模、高质量、实时性数据,如何将模...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于到底能不能其乐融融,咱就不管...……更多
卓翼飞思智能算法云仿真平台助推全国集群挑战赛,引爆行业热潮!
...北京卓翼智能科技有限公司及旗下飞思实验室研发的智能算法云仿真平台(以下简称”卓翼飞思RflySim Cloud平台”)提供全方位的智能仿真方案支持,赢得行业200多位专家及所有参赛学生的好评。政策导向 行业技术趋势尽显本...……更多
LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
...提升语言模型的对齐能力,人们已经提出了许多偏好优化算法,但它们都默认使用固定的提示词训练分布。这种固定的训练范式缺乏可扩展性,并不可避免地导致泛化问题和效率问题。基于这些考虑,谷歌 DeepMind 和芝加哥大学...……更多
前海人工智能集聚区迎来首批企业入驻
...中心和算力调度平台最高获2000万元支持“数据、算力和算法”是人工智能发展三大关键要素,《若干措施》加大了对其要素供给。在提高算力供给能力方面,鼓励开展“一云多芯、以网强算、算网融合”技术创新,推动云、数...……更多
鹰瞳科技:万语大模型通过国家深度合成服务算法备案 打造智能健康助手助力行业发展
近日,国家互联网信息办公室发布第六批深度合成服务算法备案信息公告,鹰瞳科技(2251.HK)万语大模型算法顺利通过该备案。据介绍,鹰瞳万语医疗大模型算法旨在提高对医学知识的访问和理解,促进医疗领域内的知识共享...……更多
...走稳步”的原则,重点把握好以下几个关键点。一、明确算法在模型构建中的重要价值。最高人民检察院检察长应勇指出,“法律监督应用模型是深入实施数字检察战略的重要突破口”,广泛推进数字模型应用是检察机关积极响...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...的任务求解范式。ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据GPT系列模型的技术演变(ChatGPT):在GPT-3的基础上,OpenAI又通过代码训练、人类对齐、工具使用等技术对于模型性能不断升级,推出了GPT-3.5系列模型。202...……更多
成都如何打造AI创新之城
...发展的若干政策措施》发布,《政策措施》尤其支持智能算法创新转化,对取得国家科技重大专项(含科技创新2030-重大项目)、国家重点研发计划立项项目成果或国家科学技术奖获奖成果并在蓉落地转化的,经评审择优,给...……更多
从最初入职时不知道如何向亲朋解释“算法工程师”这个职位,到和团队一起完成国产芯片嵌入式人脸识别产品,再到负责大模型研发,向着人工智能领域不断探索与突破……多年来,汉王科技股份有限公司算法工程师彭菲始...……更多
...调度管理和大模型研发全过程管理,简化了算力、数据和算法研发的复杂度,降低了算力资源损耗,提高了算法研发效率。OpenNova Series 系列开源大模型则是 OpenCSG 算法团队正在研发中的开源大模型、多模态大模型和垂类模型系...……更多
观察|“人人基因组时代”将至,谁来高效准确读懂海量生命数据?
...似的,华大基因团队基于基因检测大数据,结合先进的AI算法,提出了“生成式生物智能GBI ALL (Generative Bio-Intelligent)”创新范式。据介绍,GBI ALL理念的核心在于通过生成式生物智能技术,实现对全基因组数据的深度解析。其中,...……更多
强化学习是一种通过试错和奖励来学习最优策略的机器学习方法
...规划是机器人能够高效执行任务的关键。传统的路径规划算法往往需要提前规划好路径,但在复杂的环境中,这种方法往往无法适应实时变化的情况。因此,基于强化学习的机器人路径规划算法应运而生。强化学习是一种通过试...……更多
旷视持续践行“负责任AI”发展理念
...包括:(1)数据处理的脱敏机制、被遗忘机制等;(2)算法模型的可解释性、算法影响评估、算法安全测试、算法适用边界、监督审查算法实现过程和结果;(3)建立数据集选择、算法选取等关键决策的记录和回溯机制。人工...……更多
马上消费CTO蒋宁:安全合规的可信AI是大模型持续发展的根基
...带来了关于科技助力金融伦理建设的探索与思考。立足“算法、数据、算力”三个维度应对安全合规挑战作为深深扎根金融业务一线的资深专家,蒋宁认为,大模型新技术给行业带来了很多期望,使很多领域出现新机会,但同时...……更多
AI将爆发哪些超级应用?
...能被AI“理解”吗?什么样的数据是“基本”事实?哪些算法是衡量“公平”的指标?大模型由现实世界训练而来,因此AI也是社会的镜子。这些问题还需要更深层的审视和技术规范来解决。正文1 AI上半场,大模型和芯片大突破1...……更多
浅谈XR中的人脸识别技术
...验证和娱乐领域的应用。同时,讨论了XR技术中人脸识别算法的关键技术和实际案例,并探讨了该技术在XR应用中的优势和挑战。最后,对未来人脸识别技术发展的方向进行了展望。关键字:XR技术;人脸识别;应用前景引言:随...……更多
与ChatGPT“赛跑”!国产大模型170多天“赛”出“加速度”
...一步产业链永远无法自立。 如今,一家能够保障数据和算法,一家则保障算力。讯飞和华为“联合特战队”半年内实现星火大模型训练和推理效率均翻番。此前8月15日,在讯飞星火认知大模型V2.0升级发布会上,两家企业也携手...……更多
...居科学体系下的大模型应用发展生态,基于数据、算力、算法模型三要素,形成城市治理新生态,为城市注入新活力。“现阶段,传统的规划设计管理模式已不足以适应新形势下的发展需求,亟须以人居科学的视角进行整合创新...……更多
更多关于科技的资讯:
这几种食物悄悄藏着咖啡因 会让你整夜睡不好!
你是否有过这样的经历:明明没喝咖啡,结果翻来覆去就是睡不着,脑海中还不断闪现各种思绪?其实,这背后可能有一个“幕后黑手”——咖啡因
2025-02-04 13:11:00
埃及一饲养员不慎跌入狮笼:立刻被咬身亡
2月4日消息,动物就是动物,尤其是猛兽,注定无法养熟。近日,埃及法尤姆47岁饲养员赛义德遭狮子袭击身亡,事发后现场曝光
2025-02-04 13:11:00
PS5销量暴跌4成!日本游戏机市场5年来首次陷入萎缩
快科技2月4日消息,据日本Famitsu最新统计数据显示,2024年日本国内家用游戏市场规模(包括游戏机及游戏软件销售额)较上一年下降了25
2025-02-04 13:11:00
OpenAI CEO承认了!DeepSeek非常棒 不会起诉
当地时间2月3日,ChatGPT开发商OpenAI联合创始人兼CEO山姆·奥尔特曼(Sam Altman)在日本东京接受媒体采访时表示
2025-02-04 13:41:00
飞猪发布蛇年春节旅游快报!这三组数据太出乎意料!
快科技2月4日消息,今日,在线旅游平台飞猪发布了《2025年春节假期出游快报》,揭示了今年春节假期的旅游市场新趋势。报告显示
2025-02-04 14:11:00
车主吐槽保时捷:除了911其他质量都不行、电车尤甚!
快科技2月4日消息,多少人梦寐以求的豪华车,实际上在车主看来也就是那么回事。就在今日,知名汽车博主“韩路”在转发微博时提到保时捷销量下滑的原因所在
2025-02-04 14:11:00
蔚来高速上紧急变道躲避追尾 车主:AES救我一命
快科技2月4日消息,有博主分享了一段蔚来AES(自动紧急避让)的行车记录仪视频。视频中,车主在正常跟车行驶中,因前车未注意到前方道路堵车
2025-02-04 14:41:00
汪小菲清空带货橱窗 被拍90度鞠躬双眼红肿称“熙媛是我的家人”
快科技2月4日消息,据多家媒体综合报道,中国台湾知名女演员、歌手及主持人徐熙媛(大S)近日在日本旅游期间,因罹患流感并引发肺炎
2025-02-04 15:11:00
有人在小鹏超充被收51块占位费发帖控诉 网友:建议去特斯拉充
快科技2月4日消息,近日有小红书用户发帖称自己遭遇了充电诈骗。据其介绍,他在小鹏S4超级充电桩上充了11.5度电(SOC 24%-95%)
2025-02-04 15:41:00
9.98万起!吉利银河星舰7 EM-i购车政策公布:送8800元16喇叭音响
快科技2月4日消息,日前,吉利汽车发布了银河星舰7 EM-i 2月购车政策,活动截止至2025年2月28日,限时先享指导价区间为9
2025-02-04 15:41:00
快科技2月4日消息,据媒体报道,近日在墨西哥某海滩上,一条被海浪冲上岸的巨大鱼类引发了居民的广泛关注和恐慌。这条巨鱼体型庞大
2025-02-04 16:11:00
本周休2上4休1:下次放假需等59天
快科技2月4日消息,如同做了一场梦,新年假期就这样进入了尾声,明天绝大多数企业将正式开工。根据放假安排,本周休2天,上4天
2025-02-04 16:11:00
射雕评分人数37万票房不到6亿 肖战:我压力还好
快科技2月4日消息,根据数据平台的统计数据显示,截至目前,《射雕英雄传:侠之大者》这部备受瞩目的影片已经累计取得了5.78亿的票房佳绩
2025-02-04 17:11:00
女子套圈300个 一碰东西就反弹!都贴了透明胶带
快科技2月4日消息,过年期间免不了会凑热闹,而一些项目也就成了很多人必玩,比如射气球,又比如套圈。套圈的规则很简单,只需花钱买一些圈
2025-02-04 17:11:00
本田提议收购日产股份为子公司 但遭后者强烈反对
快科技2月4日消息,据NHK报道,本田已提议收购日产的股份并将其整合成子公司,但遭到日产的强烈反对,要想真正实现这一目标预计将会非常困难
2025-02-04 17:11:00