• 我的订阅
  • 头条热搜
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发布之前,团队就开始探索蒙特卡洛树搜索提高大模型数学...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...的前驱是DeepMind的AlphaGo。AlphaGo以前的围棋算法采用的是蒙特卡洛树搜索,试图利用计算机的算力优势进行海量模拟试错,但围棋人工智能也只能战胜业余棋手。AlphaGo的成功取决于开发出了价值网络,将价值网络、策略网络和蒙...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...们在多种搜索算法中进行选择,例如 Beam Search、Best-of-N, 蒙特卡洛树搜索等。每种算法在 PRM 的质量上有其独特的优势。复杂的搜索算法在处理更难的任务时可能表现更好,而简单的方法如最佳 N 则常能在难度较低的情况下表现...……更多
...理能力。彼时更主流的看法是,推理能力的提高可能依赖蒙特卡洛树搜索(MCTS)或过程奖励模型(PRM)。对于大模型而言,某种方法是否仍然有效,往往要看它能否经受住规模扩展的考验。在当时看来,纯强化学习的前景,并...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起...……更多
...等信息来训练深度学习模型。研究团队采用了一种被称为蒙特卡洛树搜索的算法,不仅使模型可以预测每个分子的抗菌活性,还能预测分子的哪些化学亚结构可能导致这种活性。为进一步缩小候选药物范围,他们还训练了另外三...……更多
...亚理工学院、华东师范大学合作开发,整合了强化学习和蒙特卡洛树搜索能力。据微软研究团队表示,XOT方法可以让语言模型扩展到不熟悉的问题上,并在Gameof24、8-Puzzle和PocketCube等严苛测试中展现出明显优势。XOT框架的关键步...……更多
教人工智能读懂专业文件(新职业新故事)
...智能(AI)模型。杨洪旭供职的达观数据有限公司,位于上海浦东软件园,是一家智能文本处理技术企业。这里研发的AI模型,能读懂合同工单、财务报表、行业报告等各类文本文件,在银行流水识别、合同审核与比对等多场景...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...推理方法解释!解释就解释:本文探讨了 best-of-n 采样和蒙特卡洛树搜索(MCTS)。草莓可能是一种具有特殊tokens(例如回溯、规划等)的混合深度模型。它可能会通过人类数据标注员和来自容易验证领域(如数学/编程)的强化...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
代码模型SFT对齐后,缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...通过扩展数学题库,模拟大量数学题目进行增训,并结合蒙特卡洛树搜索(MCTS)等技术,提升模型解题能力。在逻辑推理方面,腾讯还通过建立问题抽取与评价模型,显著提升了推理能力的广度与质量,最终在多项评测中再创...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语在快速发展的科技领域中,经常出现的模糊用法。值得关注的...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本,开发、业务迭代及企业落地速度大幅提升,并拥有了全新的中文名“文心快码”,正式加入百度“文心大家族”。据百度首席技术官、深...……更多
常见电子邮件分类算法的性能分析
...第07期.[4]王鹿.基于贝叶斯分类的垃圾邮件过滤技术研究.上海工程技术大学硕士论文,2021年第04期.[5]冯军军,李力.机器学习在垃圾邮件过滤中的实现.电脑知识与技术,2021 ,17 (08).作者简介:樊攀,男,2004年10月生,安徽临泉人,太...……更多
人形机器人会跳舞和空翻还不够?通用具身智能仿真平台“格物”发布
3月21日,上海张江,国家地方共建人形机器人创新中心(下称“国地中心”)举行“格物具身智能仿真平台发布会”,联合上海大学、清华大学发布高性能通用具身智能仿真平台——“格物”。据介绍,格物支持一键训练,实...……更多
最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅
...坦福团队合作的相关研究论文,关键创新点是AlphaGo同款蒙特卡洛树搜索算法结合DPO微调。总之呢,产品和论文看起来还挺正经的。就是CEO声称草莓哥账号是AI控制的这一点,网友们还是不太买账。最近围绕AI的消息太多太乱,大...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...atGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻有学者...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...动了「大模型自我进化」的流星雨研究计划。这篇文章以代码大模型和垂域大模型进化为例,逐步介绍流星雨计划。SRA-MCTS:推动代码大模型自我进化论文标题:SRA-MCTS: Self-driven Reasoning Augmentation with Monte Carlo Tree Sear……更多
谷歌deepmind公布ai模型训练法
...歌DeepMind使用PaLM2模型进行测试,研究人员建立了专用“代码池”,使用代码形式为模型输入一系列问题,并设置了评估器流程,之后模型便会在每一次迭代中,自动从代码池中挑选问题,生成“具有创造性的新解法”,并交由...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...务上的强大能力。在近日的一项研究中,来自 MIT CSAIL、上海交通大学等机构的研究者进一步探究 LLM 是否可以用来创建多样化的模拟任务,并进一步挖掘它们的能力。具体来讲,研究者提出了一种基于 LLM 的框架 GenSim,它为设计...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...争力。 庞若鸣是普林斯顿计算机博士,本硕分别毕业于上海交大和南加州大学,于2021年加入苹果,此前在谷歌担任了15年的工程师。Apple Intelligence的主要对话功能,正是由他率领的团队研发的模型提供支持。这次他还强调,这...……更多
chatgpt低成本复现流程开源
...度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,复现也是真的难。毕竟ChatGPT是...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...容易,用户现在也可以使用自己的数据来微调SAM 2的训练代码;页面演示的前端和后端代码也开源了。Spirit LM:语音+文本的语言模型大型语言模型经常被用来构建文本到语音的流程:首先通过自动语音识别(ASR)技术将语音转写...……更多
... 为粮食安全提供科技支撑俞陶然本报讯(记者 俞陶然)上海人工智能实验室昨天联合崖州湾国家实验室和中国农业大学,发布了我国首个种业大语言模型“丰登”(SeedLLM)。在上海人工智能实验室研发的大语言模型“书生·浦...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
...Pitchfork,也还在酝酿中;而微软的GitHubCopilot主要是一个代码补全工具。要说完全代替人类码农,它们还不够格。但如果真的让ChatGPT学会了用人类思维去编程,这些友商/自家的产品恐怕要被吊打。而从种种迹象看来,OpenAI似乎正...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...大于App Store,前者更多的是赋能,后者更多的是适配。”上海市数据科学重点实验室主任、复旦大学教授肖仰华对澎湃科技表示。OpenAI认为,GPT平台最终将使其更接近终极目标:创建AI超级智能或通用人工智能(AGI)。就目前而...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...新的研究成果也将在近期陆续放出。事件始末:恶意注入代码,投毒模型训练回看整件事情,可谓反转又反转。两个月前,圈内人都被这样一条消息惊掉下巴:「字节跳动大模型训练被北大实习生攻击,损失巨大」。什么仇什么...……更多
中文无代码编程工具:让每人拥有一群智能数字机器人
...能数字机器人,进而推进这场人机交互的变革。 顺应无代码趋势在体验朗思Agent智能工具过程中,我们注意到,这款具备中文无代码开发特性的智能工具不仅能帮助使用者在企业办公中完成跨平台、跨系统业务协同操作、数据...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...测试显示,旗舰模型 Qwen3-235B-A22B (激活参数为220亿)在代码、数学、通用能力等基准测试中,媲美甚至超过DeepSeek-R1、o1、o3-mini、Grok-3和谷歌Gemini-2.5-Pro等顶级模型。在大模型竞技场推出的综合能力评估ArenaHard、美国数学竞赛测.……更多
chatgpt教你写ai包教包会,准确度最高达99.7%
...hatGPT就可以创建模型。它不仅帮你找数据集、训练模型写代码,还能评估准确性、创建程序一步到位。就有这么一个25岁小哥,让ChatGPT帮他创建了个地理位置识别程序,最终准确率最高达99.7%。而且各种细节步骤全在,一边干活...……更多
更多关于科技的资讯:
匠心护航丨济宁移动圆满完成2025嘉祥圣德山野音乐节通信保障
鲁网10月20日讯10月18-19日,“共赴山野之约,让旋律在自然间共鸣”群星演唱会在嘉祥九顶山激情开唱,华语乐坛知名歌手轮番登台
2025-10-20 12:17:00
移动的 “智算样板间” 亮相青岛,施耐德电气破解算力基建难题
10月17日,一场穿行14城、总里程近2万公里的技术巡展抵达青岛。施耐德电气关键电源巡卡车化身 “数据中心行业的技术样板间”
2025-10-20 12:45:00
彰显多维综合实力,Hape重装亮相2025中国玩具展
10月15至17日,由中国玩具和婴童用品协会(简称中国玩协)主办的第二十三届CTE中国玩具展&潮玩展、第十八届CLE中国授权展
2025-10-20 13:19:00
富士胶片91年传承,始终深耕影像领域,在不同时代适时推出符合当下需求的产品.。影像的发展从未离开过"光",近日FUJIKINA 2025富士胶片影像周以"光的交响曲"为题拉开序幕
2025-10-20 13:19:00
安踏儿童足弓PRO跑鞋获国际设计金奖 以科技守护青少年足弓健康
安踏儿童旗下产品“足弓PRO跑鞋”凭借对儿童足弓健康成长的深刻洞察与科学的产品设计,荣获2025年缪斯设计奖(MUSE Design Awards)金奖
2025-10-20 13:49:00
厦门网讯(厦门日报记者 李晓平)日前,厦门市工业和信息化局组织开展人工智能政策资金申报工作,“真金白银”推进今年我市出台的《厦门市进一步推动人工智能产业发展若干措施》(以下简称《若干措施》)落地见效
2025-10-20 08:56:00
报告:研学旅游市场分化趋势明显 监管滞后发展
10月18日,“2025首届旅行服务大会暨交易展——‘跨界协作•链动未来’研学新生态思享会”在海南三亚保利国际会展中心举行
2025-10-20 09:30:00
西乡街道企业人才训练营走进北科瑞声探寻AI声纹新未来
10月16日,由西乡街道党群服务中心主办的“AI赋能·智汇西乡”企业人才训练营系列活动之北科瑞声参访学习在新一代产业园顺利举行
2025-10-20 09:48:00
姬源在数字化浪潮席卷全球的今天,一个特殊的群体正在悄然形成,他们就是阿尔法一代(GenerationAlpha)。这一代人正值智能手机
2025-10-20 10:49:00
2025微博V影响力大会揭晓9组大V荣誉,“尽兴分享”推动社会价值沉淀
10月18日,2025微博V影响力大会在北京・微博IN跨次元引力场隆重举行。作为微博主办的年度重磅平台级活动,此次大会以“尽兴分享
2025-10-20 10:49:00
新闻纵深·聚焦2025中国国际数字经济博览会|人工智能赋能产业升级“下半场”
阅读提示数字浪潮,奔涌而至。10月17日至19日,2025中国国际数字经济博览会在石家庄举办。这场综合性数字经济大会,不仅搭建起国际数字经济交流合作的高端平台
2025-10-20 07:35:00
聚焦2025中国国际数字经济博览会|数字“加料”,生活可以这么“潮”
10月17日,观众和下棋机器人对弈。河北日报记者 史晟全摄数字让生活更美好。2025中国国际数字经济博览会上,众多数智技术闪亮登场
2025-10-20 07:37:00
河北日报讯(记者宋平)10月19日,2025京津冀AI赋能教育新生态大会在石家庄举办。来自政府、高校、科研机构与企业的与会嘉宾
2025-10-20 07:42:00
青春华章丨制造业“数智化”,“脑力”岗位需求旺
南航双选会上来了237家制造业单位制造业“数智化”,“脑力”岗位需求旺□南京日报/紫金山新闻记者姜静实习生黄佳琪杨久久400多家用人单位中
2025-10-20 07:43:00