• 我的订阅
  • 头条热搜
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发布之前,团队就开始探索蒙特卡洛树搜索提高大模型数学...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...的前驱是DeepMind的AlphaGo。AlphaGo以前的围棋算法采用的是蒙特卡洛树搜索,试图利用计算机的算力优势进行海量模拟试错,但围棋人工智能也只能战胜业余棋手。AlphaGo的成功取决于开发出了价值网络,将价值网络、策略网络和蒙...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...们在多种搜索算法中进行选择,例如 Beam Search、Best-of-N, 蒙特卡洛树搜索等。每种算法在 PRM 的质量上有其独特的优势。复杂的搜索算法在处理更难的任务时可能表现更好,而简单的方法如最佳 N 则常能在难度较低的情况下表现...……更多
...理能力。彼时更主流的看法是,推理能力的提高可能依赖蒙特卡洛树搜索(MCTS)或过程奖励模型(PRM)。对于大模型而言,某种方法是否仍然有效,往往要看它能否经受住规模扩展的考验。在当时看来,纯强化学习的前景,并...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起...……更多
...等信息来训练深度学习模型。研究团队采用了一种被称为蒙特卡洛树搜索的算法,不仅使模型可以预测每个分子的抗菌活性,还能预测分子的哪些化学亚结构可能导致这种活性。为进一步缩小候选药物范围,他们还训练了另外三...……更多
...亚理工学院、华东师范大学合作开发,整合了强化学习和蒙特卡洛树搜索能力。据微软研究团队表示,XOT方法可以让语言模型扩展到不熟悉的问题上,并在Gameof24、8-Puzzle和PocketCube等严苛测试中展现出明显优势。XOT框架的关键步...……更多
教人工智能读懂专业文件(新职业新故事)
...智能(AI)模型。杨洪旭供职的达观数据有限公司,位于上海浦东软件园,是一家智能文本处理技术企业。这里研发的AI模型,能读懂合同工单、财务报表、行业报告等各类文本文件,在银行流水识别、合同审核与比对等多场景...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...推理方法解释!解释就解释:本文探讨了 best-of-n 采样和蒙特卡洛树搜索(MCTS)。草莓可能是一种具有特殊tokens(例如回溯、规划等)的混合深度模型。它可能会通过人类数据标注员和来自容易验证领域(如数学/编程)的强化...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
代码模型SFT对齐后,缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...通过扩展数学题库,模拟大量数学题目进行增训,并结合蒙特卡洛树搜索(MCTS)等技术,提升模型解题能力。在逻辑推理方面,腾讯还通过建立问题抽取与评价模型,显著提升了推理能力的广度与质量,最终在多项评测中再创...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语在快速发展的科技领域中,经常出现的模糊用法。值得关注的...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本,开发、业务迭代及企业落地速度大幅提升,并拥有了全新的中文名“文心快码”,正式加入百度“文心大家族”。据百度首席技术官、深...……更多
常见电子邮件分类算法的性能分析
...第07期.[4]王鹿.基于贝叶斯分类的垃圾邮件过滤技术研究.上海工程技术大学硕士论文,2021年第04期.[5]冯军军,李力.机器学习在垃圾邮件过滤中的实现.电脑知识与技术,2021 ,17 (08).作者简介:樊攀,男,2004年10月生,安徽临泉人,太...……更多
人形机器人会跳舞和空翻还不够?通用具身智能仿真平台“格物”发布
3月21日,上海张江,国家地方共建人形机器人创新中心(下称“国地中心”)举行“格物具身智能仿真平台发布会”,联合上海大学、清华大学发布高性能通用具身智能仿真平台——“格物”。据介绍,格物支持一键训练,实...……更多
最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅
...坦福团队合作的相关研究论文,关键创新点是AlphaGo同款蒙特卡洛树搜索算法结合DPO微调。总之呢,产品和论文看起来还挺正经的。就是CEO声称草莓哥账号是AI控制的这一点,网友们还是不太买账。最近围绕AI的消息太多太乱,大...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...atGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻有学者...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...动了「大模型自我进化」的流星雨研究计划。这篇文章以代码大模型和垂域大模型进化为例,逐步介绍流星雨计划。SRA-MCTS:推动代码大模型自我进化论文标题:SRA-MCTS: Self-driven Reasoning Augmentation with Monte Carlo Tree Sear……更多
谷歌deepmind公布ai模型训练法
...歌DeepMind使用PaLM2模型进行测试,研究人员建立了专用“代码池”,使用代码形式为模型输入一系列问题,并设置了评估器流程,之后模型便会在每一次迭代中,自动从代码池中挑选问题,生成“具有创造性的新解法”,并交由...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...务上的强大能力。在近日的一项研究中,来自 MIT CSAIL、上海交通大学等机构的研究者进一步探究 LLM 是否可以用来创建多样化的模拟任务,并进一步挖掘它们的能力。具体来讲,研究者提出了一种基于 LLM 的框架 GenSim,它为设计...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...争力。 庞若鸣是普林斯顿计算机博士,本硕分别毕业于上海交大和南加州大学,于2021年加入苹果,此前在谷歌担任了15年的工程师。Apple Intelligence的主要对话功能,正是由他率领的团队研发的模型提供支持。这次他还强调,这...……更多
chatgpt低成本复现流程开源
...度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,复现也是真的难。毕竟ChatGPT是...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...容易,用户现在也可以使用自己的数据来微调SAM 2的训练代码;页面演示的前端和后端代码也开源了。Spirit LM:语音+文本的语言模型大型语言模型经常被用来构建文本到语音的流程:首先通过自动语音识别(ASR)技术将语音转写...……更多
... 为粮食安全提供科技支撑俞陶然本报讯(记者 俞陶然)上海人工智能实验室昨天联合崖州湾国家实验室和中国农业大学,发布了我国首个种业大语言模型“丰登”(SeedLLM)。在上海人工智能实验室研发的大语言模型“书生·浦...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
...Pitchfork,也还在酝酿中;而微软的GitHubCopilot主要是一个代码补全工具。要说完全代替人类码农,它们还不够格。但如果真的让ChatGPT学会了用人类思维去编程,这些友商/自家的产品恐怕要被吊打。而从种种迹象看来,OpenAI似乎正...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...大于App Store,前者更多的是赋能,后者更多的是适配。”上海市数据科学重点实验室主任、复旦大学教授肖仰华对澎湃科技表示。OpenAI认为,GPT平台最终将使其更接近终极目标:创建AI超级智能或通用人工智能(AGI)。就目前而...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...新的研究成果也将在近期陆续放出。事件始末:恶意注入代码,投毒模型训练回看整件事情,可谓反转又反转。两个月前,圈内人都被这样一条消息惊掉下巴:「字节跳动大模型训练被北大实习生攻击,损失巨大」。什么仇什么...……更多
中文无代码编程工具:让每人拥有一群智能数字机器人
...能数字机器人,进而推进这场人机交互的变革。 顺应无代码趋势在体验朗思Agent智能工具过程中,我们注意到,这款具备中文无代码开发特性的智能工具不仅能帮助使用者在企业办公中完成跨平台、跨系统业务协同操作、数据...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...测试显示,旗舰模型 Qwen3-235B-A22B (激活参数为220亿)在代码、数学、通用能力等基准测试中,媲美甚至超过DeepSeek-R1、o1、o3-mini、Grok-3和谷歌Gemini-2.5-Pro等顶级模型。在大模型竞技场推出的综合能力评估ArenaHard、美国数学竞赛测.……更多
chatgpt教你写ai包教包会,准确度最高达99.7%
...hatGPT就可以创建模型。它不仅帮你找数据集、训练模型写代码,还能评估准确性、创建程序一步到位。就有这么一个25岁小哥,让ChatGPT帮他创建了个地理位置识别程序,最终准确率最高达99.7%。而且各种细节步骤全在,一边干活...……更多
更多关于科技的资讯:
清华大学安徽校友会AI大数据专委会揭牌
大皖新闻讯 11月20日,清华大学安徽校友会AI大数据专委会揭牌仪式暨人工智能前沿洞察与产业创新论坛在中国视界举行。人工智能是安徽省十大战略性新兴产业之一
2025-11-21 12:23:00
中新经纬11月21日电 据中消协网站21日消息,近日,有媒体曝光了一批盗版剧APP,这些APP不仅盗用大量剧集资源,更会窃取用户个人隐私信息
2025-11-21 12:37:00
“消失的法老”回来了!“BesTV上海博物馆”今天上线 计划实现上海电视用户全覆盖
11月18日,“廿念不忘,帧帧日上——百视通成立20周年分享会”在国际会议中心举行。作为20周年重磅发布之一,由百视通与上海博物馆联合打造的“BesTV上海博物馆”产品正式亮相并登陆上海移动高清电视
2025-11-20 08:06:00
入住4年仍甲醛超标!福建卫视《现场》探访实录,解码智能门的健康升级路径
近日,福州居然之家王力安防门店迎来了一位特别的客人——消费者丁先生专程送来一面写有“贴心服务暖人心,智能监测护健康”的锦旗
2025-11-20 08:06:00
厦门网讯(厦门日报记者 林露虹) 近日,专注于毫米波雷达芯片研发的厦企——矽杰微电子(厦门)有限公司(简称“矽杰微电子”)完成C1轮增资
2025-11-20 08:29:00
厦门围绕“金鸡”品牌 在影视产业链上持续发力
陈铎(中)指导员工进行《活宝档案》动画制作。海丝(厦门)电影工业产业基地施工现场。 厦门网讯(文/图 厦门日报记者 邬秀君)走进位于软件园一期的继来之(厦门)人工智能研究院有限公司
2025-11-20 08:30:00
记者走基层|集装箱“搬上”无人车 解锁配送新技能
11月1日,在廊坊座头鲸科技有限公司智能制造基地,工作人员对蓝丁智能无人配送车底盘进行性能测试。 河北日报记者 刘 杰摄11月1日清晨
2025-11-20 08:49:00
破局之法,精耕之道 《精耕者访谈》第三季·区域之王重磅开启!
11月18日,由蓝河乳业独家冠名的《精耕者访谈》第三季·区域之王正式启动。作为母婴行业首个高端访谈栏目,其始终着眼于市场一线
2025-11-20 09:06:00
北京博大健康体检管理中心盛大启幕 以“科技+精准”重新定义健康管理新标杆
11月18日上午,北京博大健康体检管理中心(简称“博大体检”或“中心”)在京举行开业典礼,正式落地北京经济技术开发区南海绿茵国际园区
2025-11-20 09:06:00
以儿童为本——赖园青的幼儿教育科学实践之路
在人工智能与教育深度融合的浪潮中,如何让技术真正服务于幼儿认知发展?上海浦东新区民办普瑞姆幼儿园园长赖园青用贯穿理论与实践的智慧教育探索
2025-11-20 10:06:00
山东移动招远分公司秋冬宽带服务义诊暖心启动 专业服务守护数字生活
胶东在线11月19日讯(通讯员王少娜徐冰鑫)秋冬时节,居民居家上网需求激增,网络卡顿、信号盲区、设备老化等问题更易影响用户使用体验
2025-11-20 10:17:00
四梯科技重磅发布智能产业工程师证书项目 推动教育科技人才一体化发展
2025年11月14日,在深圳第二十七届中国国际高新技术成果交易会第二届产教融合与科教融汇论坛上,北京四梯科技有限公司(以下简称“四梯科技”)首次面向社会正式发布“四梯智能产业工程师证书项目”(4T SIEC)
2025-11-20 11:37:00
一屏承古韵,元景越千年!联通数智重构文博文创新范式的野望
11月17日,“中华文明起源系列——‘看·见殷商’”展览总结暨博物馆高质量发展研讨会在北京大运河博物馆举行。会上回顾了“看·见殷商”展览的创新实践
2025-11-20 12:07:00
名创优品斩获国际零售地产大奖MAPIC 2025\
在法国戛纳举办的 2025 年全球零售商业地产峰会大奖(MAPIC Awards)中,名创优品凭借其MINISO LAND战略级店态
2025-11-20 14:38:00