• 我的订阅
  • 头条热搜
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发布之前,团队就开始探索蒙特卡洛树搜索提高大模型数学...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...的前驱是DeepMind的AlphaGo。AlphaGo以前的围棋算法采用的是蒙特卡洛树搜索,试图利用计算机的算力优势进行海量模拟试错,但围棋人工智能也只能战胜业余棋手。AlphaGo的成功取决于开发出了价值网络,将价值网络、策略网络和蒙...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...们在多种搜索算法中进行选择,例如 Beam Search、Best-of-N, 蒙特卡洛树搜索等。每种算法在 PRM 的质量上有其独特的优势。复杂的搜索算法在处理更难的任务时可能表现更好,而简单的方法如最佳 N 则常能在难度较低的情况下表现...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起...……更多
...等信息来训练深度学习模型。研究团队采用了一种被称为蒙特卡洛树搜索的算法,不仅使模型可以预测每个分子的抗菌活性,还能预测分子的哪些化学亚结构可能导致这种活性。为进一步缩小候选药物范围,他们还训练了另外三...……更多
...亚理工学院、华东师范大学合作开发,整合了强化学习和蒙特卡洛树搜索能力。据微软研究团队表示,XOT方法可以让语言模型扩展到不熟悉的问题上,并在Gameof24、8-Puzzle和PocketCube等严苛测试中展现出明显优势。XOT框架的关键步...……更多
教人工智能读懂专业文件(新职业新故事)
...智能(AI)模型。杨洪旭供职的达观数据有限公司,位于上海浦东软件园,是一家智能文本处理技术企业。这里研发的AI模型,能读懂合同工单、财务报表、行业报告等各类文本文件,在银行流水识别、合同审核与比对等多场景...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...推理方法解释!解释就解释:本文探讨了 best-of-n 采样和蒙特卡洛树搜索(MCTS)。草莓可能是一种具有特殊tokens(例如回溯、规划等)的混合深度模型。它可能会通过人类数据标注员和来自容易验证领域(如数学/编程)的强化...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
代码模型SFT对齐后,缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...通过扩展数学题库,模拟大量数学题目进行增训,并结合蒙特卡洛树搜索(MCTS)等技术,提升模型解题能力。在逻辑推理方面,腾讯还通过建立问题抽取与评价模型,显著提升了推理能力的广度与质量,最终在多项评测中再创...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语在快速发展的科技领域中,经常出现的模糊用法。值得关注的...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本,开发、业务迭代及企业落地速度大幅提升,并拥有了全新的中文名“文心快码”,正式加入百度“文心大家族”。据百度首席技术官、深...……更多
常见电子邮件分类算法的性能分析
...第07期.[4]王鹿.基于贝叶斯分类的垃圾邮件过滤技术研究.上海工程技术大学硕士论文,2021年第04期.[5]冯军军,李力.机器学习在垃圾邮件过滤中的实现.电脑知识与技术,2021 ,17 (08).作者简介:樊攀,男,2004年10月生,安徽临泉人,太...……更多
最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅
...坦福团队合作的相关研究论文,关键创新点是AlphaGo同款蒙特卡洛树搜索算法结合DPO微调。总之呢,产品和论文看起来还挺正经的。就是CEO声称草莓哥账号是AI控制的这一点,网友们还是不太买账。最近围绕AI的消息太多太乱,大...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...atGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻有学者...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...动了「大模型自我进化」的流星雨研究计划。这篇文章以代码大模型和垂域大模型进化为例,逐步介绍流星雨计划。SRA-MCTS:推动代码大模型自我进化论文标题:SRA-MCTS: Self-driven Reasoning Augmentation with Monte Carlo Tree Sear……更多
谷歌deepmind公布ai模型训练法
...歌DeepMind使用PaLM2模型进行测试,研究人员建立了专用“代码池”,使用代码形式为模型输入一系列问题,并设置了评估器流程,之后模型便会在每一次迭代中,自动从代码池中挑选问题,生成“具有创造性的新解法”,并交由...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...务上的强大能力。在近日的一项研究中,来自 MIT CSAIL、上海交通大学等机构的研究者进一步探究 LLM 是否可以用来创建多样化的模拟任务,并进一步挖掘它们的能力。具体来讲,研究者提出了一种基于 LLM 的框架 GenSim,它为设计...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...争力。 庞若鸣是普林斯顿计算机博士,本硕分别毕业于上海交大和南加州大学,于2021年加入苹果,此前在谷歌担任了15年的工程师。Apple Intelligence的主要对话功能,正是由他率领的团队研发的模型提供支持。这次他还强调,这...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...容易,用户现在也可以使用自己的数据来微调SAM 2的训练代码;页面演示的前端和后端代码也开源了。Spirit LM:语音+文本的语言模型大型语言模型经常被用来构建文本到语音的流程:首先通过自动语音识别(ASR)技术将语音转写...……更多
... 为粮食安全提供科技支撑俞陶然本报讯(记者 俞陶然)上海人工智能实验室昨天联合崖州湾国家实验室和中国农业大学,发布了我国首个种业大语言模型“丰登”(SeedLLM)。在上海人工智能实验室研发的大语言模型“书生·浦...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
...Pitchfork,也还在酝酿中;而微软的GitHubCopilot主要是一个代码补全工具。要说完全代替人类码农,它们还不够格。但如果真的让ChatGPT学会了用人类思维去编程,这些友商/自家的产品恐怕要被吊打。而从种种迹象看来,OpenAI似乎正...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...大于App Store,前者更多的是赋能,后者更多的是适配。”上海市数据科学重点实验室主任、复旦大学教授肖仰华对澎湃科技表示。OpenAI认为,GPT平台最终将使其更接近终极目标:创建AI超级智能或通用人工智能(AGI)。就目前而...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...新的研究成果也将在近期陆续放出。事件始末:恶意注入代码,投毒模型训练回看整件事情,可谓反转又反转。两个月前,圈内人都被这样一条消息惊掉下巴:「字节跳动大模型训练被北大实习生攻击,损失巨大」。什么仇什么...……更多
中文无代码编程工具:让每人拥有一群智能数字机器人
...能数字机器人,进而推进这场人机交互的变革。 顺应无代码趋势在体验朗思Agent智能工具过程中,我们注意到,这款具备中文无代码开发特性的智能工具不仅能帮助使用者在企业办公中完成跨平台、跨系统业务协同操作、数据...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...数据。而最近一个多月,混元大模型能力提升比较大的在代码能力以及数据推理,效果较此前有20%的提升。并且,对话上下文窗口,也从原来的4K,中小模型可以长至16K。而第三季度,可以说是国内大模型领域的关键节点——包...……更多
世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类
...刚刚一口气连肝了10篇论文。从提出研究想法、实验、写代码,再到GPU上执行实验,收集结果,AI承包了整个机器学习研究的全过程。更让人难以置信的是,从构思到成文,一篇论文的成本仅需15美金(107.61元)。「AI科学家」是...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...)被寄予厚望。众所周知,近期发布的 OpenAI o1 在数学、 代码、长程规划等问题上取得了显著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。基于此,有人认为,新的扩展律 —— 后训练扩展...……更多
百度文心大模型4.0技术进展
...也达到了理解的2倍多。百度基于文心大模型研制了智能代码助手Comate,从内部应用效果来看,整体的代码采纳率达到40%,高频用户的代码采纳率达到60%。据悉,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...ixtral-8x22B等相比,在多学科综合评测集、中英文NLP任务、代码、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基础测试等主要技术创新...……更多
更多关于科技的资讯:
盒马启用“电子验蟹师”,专挑肥满度超七成的报恩大闸蟹
秋分一过,大闸蟹长成,开始批量上市。近期,盒马的大闸蟹也正式上架,还做出了“不肥包退”的承诺。能够做到“不肥包退”,是因为今年盒马推出了首个大闸蟹分级企业标准
2025-09-24 20:37:00
康宝莱全球产品创新中心焕新启航 智驱未来 聚力共赢
2025年9月23日,上海 - 全球知名的健康公司康宝莱今日在上海举行“康宝莱全球产品创新中心”揭幕仪式。该中心由原“康宝莱中国产品创新中心”战略升级而成
2025-09-24 20:45:00
近日,由山东移动张店公司为区融媒体中心量身打造的“智慧研学服务平台”正式投入使用。该平台以信息化手段打通家长、教师、基地之间的信息壁垒
2025-09-24 20:48:00
2025第五届邹区国际照明博览会将于9月26日启幕
备受行业关注的2025第五届邹区国际照明博览会将于9月26日正式拉开帷幕,将集合全球照明领域的最新技术成果与产品,致力于促进产业链各环节的深度协作
2025-09-24 20:55:00
冲刺三季度 决胜下半年|华药(十堰)药业:AI“慧眼”识药 质效大幅提升
十堰广电讯(全媒体记者 翁红)华药(十堰市)药业有限公司中药饮片生产线项目是京堰对口协作重点招商项目。自今年6月试生产以来
2025-09-24 21:00:00
我武生物践行“实业报国,治病救人”,无偿助力“畅享呼吸”
由北京康盟慈善基金会与北京生命绿洲公益服务中心共同发起的“医药筹—畅享呼吸患者援助项目”,将于2025年10月1日起正式将援助范围扩展至甘肃省
2025-09-24 21:24:00
华为这一突破,意义非同寻常
(一)关注中国科技,我们必须关注华为;关注华为,我们必然就看到这一突破。我的第一感觉,这个突破,意义非凡。对华为来说是这样
2025-09-24 07:34:00
全球首发,钟楼智造闪耀第25届中国国际工业博览会!
9月23日第25届中国国际工业博览会(简称“工博会”)在上海盛大启幕这场聚焦“新质”展现大国工业硬核实力的博览会以“工业新质
2025-09-24 20:55:00
在制造业提质增效的浪潮中,那些藏在生产环节里的“细枝末节”,往往藏着撬动效益升级的关键密码。近日,太重包储分公司的散件箱优化项目传来捷报
2025-09-24 07:52:00
被3000亿资金哄抢的创新药企,上市首日暴涨110%
文|胡香赟编辑|海若镜港股迎来今年第11家上市的创新药公司。9月19日,劲方医药在港交所挂牌,首日涨幅接近110%、市值逼近150亿
2025-09-24 06:26:00
2025北京文化论坛“虚实无界:视听产业融合破圈”平行论坛举办
中国青年报客户端北京9月23日电(中青报·中青网记者 沈杰群)今天,2025北京文化论坛平行论坛——“虚实无界:视听产业融合破圈”在北京国际饭店会议中心举行
2025-09-24 00:03:00
中信银行南京分行成功举办“小天元”企业生态服务平台江苏区域发布会
9月22日下午,在百余家江苏企业代表的共同见证下,中信银行“小天元”企业生态服务平台江苏区域发布会暨“进万企 信服惠企”系列活动在南京成功举办
2025-09-23 23:15:00
聚焦京津冀协同发展|一个平台,推动黄骅模具迈向高端
北京市科学技术委员会牵头,京冀相关单位共建智能模具科技成果转化中试平台一个平台,推动黄骅模具迈向高端9月11日,智能模具科技成果转化中试平台工作人员正在操作四轴机床进行生产
2025-09-23 08:49:00
AI赋能千行百业一线故事(十二):数智化转型,让电厂越来越智慧
数智化转型,让电厂越来越智慧——AI赋能千行百业一线故事(十二)8月28日,石家庄良村热电有限公司生产技术部专业主管苏朝宏介绍智慧展厅
2025-09-23 08:53:00
“产业炬光灯”系列短视频首期聚焦中材航特
“产业炬光灯”系列短视频于厦门日报官方视频号、抖音号、快手号、B站账号、央视频账号等全媒体平台同步上线,首期节目走进中材航特
2025-09-23 08:58:00