上海,代码,学习,训练,模型,蒙特卡洛头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...项目刚刚发布，来自上海AI Lab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGo Zero的双重策略范式（先验策略+价值评估）。在2024年6月，o1发布之前，团队就开始探索蒙特卡洛树搜索提高大模型数学...……更多

2024-11-06 09:49:00上海,代码,学习,训练,模型,蒙特卡洛

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...的前驱是DeepMind的AlphaGo。AlphaGo以前的围棋算法采用的是蒙特卡洛树搜索，试图利用计算机的算力优势进行海量模拟试错，但围棋人工智能也只能战胜业余棋手。AlphaGo的成功取决于开发出了价值网络，将价值网络、策略网络和蒙...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...们在多种搜索算法中进行选择，例如 Beam Search、Best-of-N, 蒙特卡洛树搜索等。每种算法在 PRM 的质量上有其独特的优势。复杂的搜索算法在处理更难的任务时可能表现更好，而简单的方法如最佳 N 则常能在难度较低的情况下表现...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

DeepSeek的能力，到底从哪里来？

...理能力。彼时更主流的看法是，推理能力的提高可能依赖蒙特卡洛树搜索（MCTS）或过程奖励模型（PRM）。对于大模型而言，某种方法是否仍然有效，往往要看它能否经受住规模扩展的考验。在当时看来，纯强化学习的前景，并...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！新模型不仅在长思维能力方面有了很大提升，而且还能在推理过程中进行自我反思和纠正。先来一起...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

人工智能帮助发现新型候选抗生素

...等信息来训练深度学习模型。研究团队采用了一种被称为蒙特卡洛树搜索的算法，不仅使模型可以预测每个分子的抗菌活性，还能预测分子的哪些化学亚结构可能导致这种活性。为进一步缩小候选药物范围，他们还训练了另外三...……更多

2024-01-01 22:25:00人工智能,抗生素,抗生,人工,帮助,智能

微软推出xot新型人工智能方法

...亚理工学院、华东师范大学合作开发，整合了强化学习和蒙特卡洛树搜索能力。据微软研究团队表示，XOT方法可以让语言模型扩展到不熟悉的问题上，并在Gameof24、8-Puzzle和PocketCube等严苛测试中展现出明显优势。XOT框架的关键步...……更多

2023-11-16 09:37:00微软,人工智能,人工,智能,方法,微软

教人工智能读懂专业文件（新职业新故事）

...智能（AI）模型。杨洪旭供职的达观数据有限公司，位于上海浦东软件园，是一家智能文本处理技术企业。这里研发的AI模型，能读懂合同工单、财务报表、行业报告等各类文本文件，在银行流水识别、合同审核与比对等多场景...……更多

2024-08-27 06:09:00人工智能,人工,智能,文件,职业,故事

小模型越级挑战14倍参数大模型，谷歌Test-Time端新的

...推理方法解释！解释就解释：本文探讨了 best-of-n 采样和蒙特卡洛树搜索（MCTS）。草莓可能是一种具有特殊tokens（例如回溯、规划等）的混合深度模型。它可能会通过人类数据标注员和来自容易验证领域（如数学/编程）的强化...……更多

2024-09-12 09:58:00模型,参数,模型,训练,测试,时计

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

...通过扩展数学题库，模拟大量数学题目进行增训，并结合蒙特卡洛树搜索（MCTS）等技术，提升模型解题能力。在逻辑推理方面，腾讯还通过建立问题抽取与评价模型，显著提升了推理能力的广度与质量，最终在多项评测中再创...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

权威AI开源标准1.0版发布：Llama也不算开源

...，人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会（Open Source Initiative，OSI）发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语在快速发展的科技领域中，经常出现的模糊用法。值得关注的...……更多

2024-10-30 09:52:00权威,标准,数据,模型,系统,训练

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本，开发、业务迭代及企业落地速度大幅提升，并拥有了全新的中文名“文心快码”，正式加入百度“文心大家族”。据百度首席技术官、深...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

常见电子邮件分类算法的性能分析

...第07期.[4]王鹿.基于贝叶斯分类的垃圾邮件过滤技术研究.上海工程技术大学硕士论文,2021年第04期.[5]冯军军，李力.机器学习在垃圾邮件过滤中的实现.电脑知识与技术,2021 ,17 (08).作者简介：樊攀，男，2004年10月生，安徽临泉人，太...……更多

2024-08-26 09:59:00性能分析,算法,电子邮件,性能,常见,邮件

人形机器人会跳舞和空翻还不够？通用具身智能仿真平台“格物”发

3月21日，上海张江，国家地方共建人形机器人创新中心（下称“国地中心”）举行“格物具身智能仿真平台发布会”，联合上海大学、清华大学发布高性能通用具身智能仿真平台——“格物”。据介绍，格物支持一键训练，实...……更多

2025-03-21 12:58:00空翻,人形,用具,机器人,仿真,不够

最癫OpenAI爆料者竟是AI智能体？？CEO出来认领，网友

...坦福团队合作的相关研究论文，关键创新点是AlphaGo同款蒙特卡洛树搜索算法结合DPO微调。总之呢，产品和论文看起来还挺正经的。就是CEO声称草莓哥账号是AI控制的这一点，网友们还是不太买账。最近围绕AI的消息太多太乱，大...……更多

2024-08-15 09:31:00爆料,智能,网友,草莓,斯坦,基准

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...atGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta、DeepMind和谷歌等为核心，发了不少达到SOTA的模型。这不，立刻有学者...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

推动大模型自我进化，北理工推出「流星雨计划」

...动了「大模型自我进化」的流星雨研究计划。这篇文章以代码大模型和垂域大模型进化为例，逐步介绍流星雨计划。SRA-MCTS：推动代码大模型自我进化论文标题：SRA-MCTS: Self-driven Reasoning Augmentation with Monte Carlo Tree Sear……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

谷歌deepmind公布ai模型训练法

...歌DeepMind使用PaLM2模型进行测试，研究人员建立了专用“代码池”，使用代码形式为模型输入一系列问题，并设置了评估器流程，之后模型便会在每一次迭代中，自动从代码池中挑选问题，生成“具有创造性的新解法”，并交由...……更多

2023-12-16 02:20:00模型,训练,模型,问题,训练,研究人员

语言、机器人破壁，MIT等用GPT-4生成模拟任务，并迁移到

...务上的强大能力。在近日的一项研究中，来自 MIT CSAIL、上海交通大学等机构的研究者进一步探究 LLM 是否可以用来创建多样化的模拟任务，并进一步挖掘它们的能力。具体来讲，研究者提出了一种基于 LLM 的框架 GenSim，它为设计...……更多

2023-10-17 16:58:00机器人,生成,机器,任务,语言,世界

苹果AI版iOS首日火爆：聊天秒变高情商，大模型成最强嘴替

...争力。庞若鸣是普林斯顿计算机博士，本硕分别毕业于上海交大和南加州大学，于2021年加入苹果，此前在谷歌担任了15年的工程师。Apple Intelligence的主要对话功能，正是由他率领的团队研发的模型提供支持。这次他还强调，这...……更多

2024-07-31 09:39:00情商,火爆,模型,苹果,模型,苹果

chatgpt低成本复现流程开源

...度最高可提升7.73倍，单卡推理速度提升1.42倍，仅需一行代码即可调用。对于微调任务，可最多提升单卡的微调模型容量3.7倍，同时保持高速运行，同样仅需一行代码。要知道，ChatGPT火是真的火，复现也是真的难。毕竟ChatGPT是...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...容易，用户现在也可以使用自己的数据来微调SAM 2的训练代码；页面演示的前端和后端代码也开源了。Spirit LM：语音+文本的语言模型大型语言模型经常被用来构建文本到语音的流程：首先通过自动语音识别（ASR）技术将语音转写...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

AI育种大模型“丰登”问世为粮食安全提供科技支撑

... 为粮食安全提供科技支撑俞陶然本报讯（记者俞陶然）上海人工智能实验室昨天联合崖州湾国家实验室和中国农业大学，发布了我国首个种业大语言模型“丰登”（SeedLLM）。在上海人工智能实验室研发的大语言模型“书生·浦...……更多

2024-04-29 05:58:00育种,粮食,模型,安全,科技,育种

传openai全球招外包大军手把手训练chatgpt取代码农

...Pitchfork，也还在酝酿中；而微软的GitHubCopilot主要是一个代码补全工具。要说完全代替人类码农，它们还不够格。但如果真的让ChatGPT学会了用人类思维去编程，这些友商/自家的产品恐怕要被吊打。而从种种迹象看来，OpenAI似乎正...……更多

2023-01-30 17:19:00手把,大军,训练,代码,全球,代码

OpenAI推出GPT商店，人人可0代码自制智能体，业界看好

...大于App Store，前者更多的是赋能，后者更多的是适配。”上海市数据科学重点实验室主任、复旦大学教授肖仰华对澎湃科技表示。OpenAI认为，GPT平台最终将使其更接近终极目标：创建AI超级智能或通用人工智能（AGI）。就目前而...……更多

2023-11-07 15:48:00人人,业界,商店,苹果,代码,智能

惊掉下巴！被字节起诉800万实习生，拿下NeurIPS 20

...新的研究成果也将在近期陆续放出。事件始末：恶意注入代码，投毒模型训练回看整件事情，可谓反转又反转。两个月前，圈内人都被这样一条消息惊掉下巴：「字节跳动大模型训练被北大实习生攻击，损失巨大」。什么仇什么...……更多

2024-12-05 09:47:00实习生,下巴,字节,实习,论文,模型

中文无代码编程工具：让每人拥有一群智能数字机器人

...能数字机器人，进而推进这场人机交互的变革。顺应无代码趋势在体验朗思Agent智能工具过程中，我们注意到，这款具备中文无代码开发特性的智能工具不仅能帮助使用者在企业办公中完成跨平台、跨系统业务协同操作、数据...……更多

2024-06-13 10:43:00一群,编程工具,中文,机器人,机器,编程

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

...测试显示，旗舰模型 Qwen3-235B-A22B （激活参数为220亿）在代码、数学、通用能力等基准测试中，媲美甚至超过DeepSeek-R1、o1、o3-mini、Grok-3和谷歌Gemini-2.5-Pro等顶级模型。在大模型竞技场推出的综合能力评估ArenaHard、美国数学竞赛测.……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球